En un post anterior, he utilizado la pdftk herramienta para extraer páginas de un archivo pdf. No tenía ninguna razón para investigar soluciones alternativas hasta que me encontré con el siguiente problema.
tuve que extraer las primeras 4 páginas de un documento pdf. El comando normalmente confiable pdftk genera una excepción de Java.
$ pdftk T4.pdf cat 1-4 de salida outputT4.pdf
excepción no controlada Java:
Excepción no controlada Java:
java.lang.NullPointerException en gnu.gcj.runtime.NameFinder.lookup (libgcj.so.12)
en java.lang.Throwable.getStackTrace (libgcj.so.12)
en java.lang.Throwable.stackTraceString (libgcj. so.12)
en java.lang.Throwable.printStackTrace (libgcj.so.12)
en java.lang.Throwable.printStackTrace (libgcj.so.12)
Para solucionar el problema, ejecuté el pdftk de comandos mediante un archivo pdf de entrada diferente. Funcionó muy bien. El problema parece ser el archivo pdf de entrada específico.
En ese momento, empecé a buscar una herramienta alternativa.
gs , también conocido como Ghostscript, es una vista previa de PDF, así como los archivos PostScript.
Puede dirigir gs de salida a varios dispositivos de salida mediante el -sDEVICE de parámetros. Pdfwrite El dispositivo especifica que la salida será en formato de archivo PDF.
El rango de la página para extraer se define por -dFirstPage y -dLastPage Parámetros. El nombre del archivo de salida se especifica utilizando -sOutputFile de parámetros.
$ gs-sDEVICE = pdfwrite-dNOPAUSE-dBATCH-dSAFER-dFirstPage = 1
-dLastPage = 4-sOutputFile = outputT4.pdf T4.pdf
GPL Ghostscript 9.05 (2012 - /> 02-08)
Este software viene con NINGUNA GARANTÍA:.. ver el PÚBLICA archivo para detalles
**** Advertencia: considerando '0000000000 XXXXX n 'como una entrada gratuita
**** Advertencia:. considerando '0000000000 XXXXX n' como una entrada gratuita
**** Advertencia:. considerando '0000000000 XXXXX n 'como un entrada gratuita.
páginas elaboración 1 a 4.
Page 1 Carga de la fuente NimbusSanL-mento desde / usr/share/fonts/type1/gsfonts/n019003l.pfb ... 4287624 2669241 2475832 1154775 3 hecho.
Cargando fuente NimbusSanL-Bold desde / usr/share/fonts/type1/gsfonts/n019004l.pfb ... 4328616 2778664 2516200 1192102 3 hecho.
Cargando fuente NimbusMonL-mento desde / usr/share/fonts/type1/gsfonts/n022003l.pfb ... 4371912 2946486 2677672 1350807 3 hecho.
Page 2 Cargando NimbusSanL-BoldItal fuente desde / usr/share/fonts/type1/gsfonts/n019024l.pfb ... 4431472 2877228 2738224 1120988 3 hecho.
Cargando fuente NimbusSanL-ReguItal desde / usr/share/fonts/type1/gsfonts/n019023l.pfb ... 4471488 2998784 2758408 1209901 3 hecho.
Página 3 Página 4
**** Este archivo había errores que fueron reparados o ignorados.
**** El archivo se ha producido por :
**** >>>> iText 1.4.5 (por lowagie.com) <<<<
**** Por favor notifique al autor del software que produjo esta
* *** archivo que no se ajusta a la publicada PDF de Adobe
**** especificación.
Los mensajes de salida por encima de siempre ni idea de por qué el archivo pdf de entrada era problemática. El archivo pdf no «se ajusta a las especificaciones publicadas de Adobe PDF.» A su favor, gs «reparado o ignorado» el problema. Se continuó con éxito para extraer las páginas. En este ejemplo en particular, gs es más tolerante a fallos que su contraparte, pdftk