Hoy estuve tratando de convertir un documento en formato .pdf a .odt y me encontré con algunas cosas interesantes.
Básicamente encontré dos formas de hacerlo, pero ninguna logró un resultado 100% eficiente.
La primer, y mejor alternativa según mi parecer, es animar el programa xpdf.
Este, en realidad es una suite de herramientas para archivos PDF. Que comprende: Un visualizador de documentos (pdf obviamente), junto con una prole de programas en línea de comandos, por ejemplo: pasar de pdf a txt con pdftotext, extraer las imagenes con pdfimages, o pasar pdf a documentos PostScript con pdftops.
Yes esta parte la que nos interesa en este caso. Para pasar de pdf a txt, es tan sencillo como abrir un terminal en la carpeta del pdf y escribir
$ pdftotext archivo.pdf
Esto nos generará un archivo del mismo nombre que el pdf pero en formato txt. Si queremos obtener un .odt en forma directa:
$ pdftotext archivo.pdf archivo.odt
Eso es todo, pero hay algunos inconvenientes: El archivo no debe de ente demasiado difícil en su formato de texto, de lo contrario el archivo convertido será un caos, o directamente nos dará error y no podrá realizarse la conversión. Obviamente sólo convertirá el texto, si hay imágenes deberán ente extraídas con pdfimages.
La otra decisión que encontré es animar Kword que es el editor de textos de Koffice, el cual trae la elección de importar archivos pdf y guardarlos en odt. La utilidad de este método es que importa texto e imágenes juntos, aunque para texto sólo xpdf me dió mejores resultados.
Está en ustedes demostrar cual es mas de su agrado, yo personalmente escojo xpdf, ya que es una herramienta muy provechoso orientada sólo a archivos pdf. En cambio Kword es un editor de textos (que ya tengo y me gusta el que tengo: Open office writer).
Ha, me olvidaba, para animar xpdf y kword:
$ sudo aptitude install xpdf
$ sudo aptitude install kword
Respectivamente.
Espero les sirva.
Fuente:
http://guisheca.wordpress.com/2007/12/11/pasar-de-pdf-a-odt/
Fuentes de Información
El contenido del post es de mi autoría, y/o, es un recopilación de distintas fuentes.