Linux y programación
Noticias, dudas y soluciones de Linux y programación

El tiempo en Badajoz

Sugerencias:

Esta bitácora fue creada por linuxcpp el día 24-09-06. Se han publicado 102 historias y 158 comentarios.


Foto del creador
Nombre: linuxcpp
Descripción: José Ramón Rubio
Localidad: Caceres
E-mail

Llamame con Gizmo

¿Qué le parece la nueva distribución gnuLinex 2006?
Excelente
Muy buena
Buena
Normal
Mala
Pésima

Ver resultados
Ver comentarios

    <<  Septiembre 2010  >>
    DomLunMarMieJueVieSab
       1234
    567891011
    12131415161718
    19202122232425
    2627282930  

Powered by eXtreblog  Use OpenOffice.org Add to Technorati Favorites  Bitacoras.com


Free Software Top
gnuLinEx 2006: de SARGE A ETCH: Última actualización: 12/01/2008

Manipulando ficheros PDF
Autor: linuxcpp _ URL _ Tb () _ Categorias: LINUX- Utilidades, LINUX- Software

Manipulando
ficheros pdf




  Como ya sabreis, PDF (Portable Document Format) es un formato de almacenamiento de documentos, desarrollado por la empresa Adobe System. Ideado principalmente para documentos susceptibles de ser impresos. Se trata de una especificación abierta, para la que se han generado herramientas de Software Libre que permiten crear, visualizar o modificar ficheros en formato PDF.
 
  Podía hablaros de herramientas para crear o visualizar PDF, pero creo que es algo que más o menos ya conocemos. En mi caso, para crear ficheros PDF suelo usar la suite ofimática Open Office, mientras que para visualizar PDF uso el programa acroread (Adobe Reader) o el programa Evince. En este post, voy a hablar de un software bastante útil para la manipulación de ficheros PDF.

  La herramienta de la que voy a hablar es pdftk. La instalación la podemos hacer con un simple apt-get install pdftk, o haciendo click en el siguiente enlace:

Descargar pdftk

  El programa pdftk es una herramienta sencilla para hacer operaciones habituales con documentos PDF. Evidentemente este programa no nos va a permitir editar un PDF como haríamos con un documento de texto por ejemplo, pero las opciones que ofrece resultan muy interesantes.
  Las principales funcionalidades que ofrece esta herramienta son las siguientes:
  • Unir dos o más ficheros PDF en un nuevo documento:
pdftk fich1.pdf fich2.pdf fich3.pdf cat output salida.pdf
Otra forma de hacerlo: pdftk *.pdf cat output salida.pdf

  • Separar páginas concretas de varios PDF en un nuevo documento:
pdftk A=fich1.pdf B=fich2.pdf cat A1-7 B1-5 A8 output salida.pdf
(En este ejemplo, el fichero salida.pdf es la unión de las páginas: de la 1 a la 7 de fich1.pdf, luego las páginas de 1 a 5 de fich2.pdf, y por último la página 8 de fich1.pdf)

  • Cifrar un documento usando 128-Bit y retener todos los permisos:
pdftk fich.pdf output salida.pdf owner_pw foopass

  • Igual que lo anterior pero añadiéndole una contraseña:
pdftk fich.pdf output salida.pdf owner_pw foo user_pw PASSWORD
(En PASSWORD indicamos la contraseña)

  • Igual que lo anterior pero permitiendo imprimir el documento una vez abierto:
pdftk fich.pdf output salida.pdf owner_pw foo user_pw PASSWORD allow printing
(Otros permisos que puede darse son: DegradedPrinting, ModifyContents, Assembly, CopyContents, ScreenReaderes, ModifyAnnotations, FillIn y AllFeatures)

  • Descifrar un pdf:
pdftk fich_cifrado.pdf input_pw foopass output salida.pdf

  • Unir dos archivos, estando uno de ellos cifrado:
pdftk A=fich_cifrado.pdf fich_normal.pdf input_pw A=foopass cat output salida.pdf
(El fichero PDF resultado NO estará cifrado)

  • Descomprimir los flujos de página para editar el código PDF en un editor de texto:
pdftk fich.pdf output fichero_salida.pdf uncompress

  • Reparar una tabla XREF o las longitudes del flujo de páginas de un PDF:
pdftk fich_roto.pdf output fich_reparado.pdf
(No siempre es posible la reparación)

  • Separar un documento en páginas sueltas, y escribir los datos del documento en el fichero de texto doc_data.txt:
pdftk fich.pdf burst

  • Escribir un informe sobre los metadatos, marcadores y etiquetas de página de un PDF:
pdftk fich.pdf dump_data output informe.txt

  Como vemos, la herramienta pdftk ofrece muchas opciones. Para conocer más en detalle el funcionamiento del programa, y todas las opciones disponibles, basta con acceder a la ayuda del programa usando el comando man pdftk

 
  Hay otras herramientas muy interesantes para tratar ficheros PDF; mejor dicho, para convertir ficheros PDF a otros formatos más editables. Los que voy a comentar a continuación son programas que pueden ser descargados con un simple apt-get install:
  • pdftohtml: Conversor de PDF a HTML.
  • html2ps: Conversor de ficheros HTML a PS o PDF.
  • pdftotext: Conversor de PDF a TXT.
  • pdftops: Conversor de PDF a PS.
  • ps2pdf: Conversor de PS a PDF. (Útiles también: ps2pdf12, ps2pdf13 y ps2pdfwr)
  • pdfimages: Extractor de imágenes de un fichero PDF.
  • pdffonts: Analizador de fuentes de un fichero PDF.

  Las fuentes que he usado para pdftk son:



Comentarios (3)
MeneameMenéame Barrapunto Barrapunto Technorati Technorati Google Google Bookmarks Fresqui Fresqui Delicious del.icio.us
VOTACIÓN: Votos(Núm. votos: 5)

RESPUESTA A Manipulando ficheros PDF
Autor: Emiliano _ URL _ Tb () _ Categorias:

Hay también otra herramienta para editar los pdf:
"pdfedit". Tiene opción para hacerlo de forma gráfica y también mediante comandos. Creo que hace falta pdtk para que funcione, pues me parece que cuando la instalé también la bajo, no estoy seguro.
Me han venido bien los comandos de la "navaja", pues
tengo que separar dos páginas de un documento que uní mal con esta, pues no permite separarlas.
Pdfedit viene bien para rellenar formularios.
Un saludo,
Emiliano
Badajoz

RESPUESTA A Manipulando ficheros PDF
Autor: linuxcpp _ URL _ Tb () _ Categorias:

Buenas.

No había llegado a probar el programa pdfedit, pero la verdad es que tiene muy buena pinta. Y además también se puede instalar muy fácilmente con apt-get install. Gracias por el comentario.

Sin duda este programa completa algunos de los puntos débiles del programa pdftk, porque permite gráficamente introducir texto en el PDF por ejemplo, muy útil para formularios como bien mencionas.
Una de las ventajas que puede tener pdftk, y que no he mencionado en el post, es la posibilidad de crear scripts para nautilus, donde por ejemplo con un CLICK se pueda cifrar o descifrar un PDF,...

Saludos.

RESPUESTA A Manipulando ficheros PDF
Autor: Emiliano _ URL _ Tb () _ Categorias:

De pdftk, he leido que es muy potente y muy versátil. Creo que lo llaman "la navaja suiza del pdf"
Uso pdfedit para rellenar formularios, principalmente, pues para crearlos, como normalmente
uso el scanner, pues lo que hago es enviar la imagen
a cups y lo guardo como pdf.
En windows uso dopdf, que es una impresora de pdf y pdfxchangeviewer, para introducir texto y visualizar los archivos que no puedo ver con sumatrapdf. Los tres están en español y son gratis. Sumatra es gpl,
muy liviano y muy rápido, semejante a Xpdf.
Otra cosa he leido que el formato pdf quieren adoptarlo como iso y ya están comenzando a definir el protocolo, que no sea el propietario de adobe.
Un saludo,
Emiliano

Escribe tu comentario


Usuario de eXtreblog (sí/no)

Nombre:

Contraseña:
?


Comentario:

Escribe el resultado de la suma:






"Linux y programación"
I would love to change the world, but they won't give me the source code