pdftoppm convierte las páginas de un documento PDF en formatos de imagen como PNG y otros. Es una herramienta de línea de comandos que puede convertir un documento PDF completo en archivos de imagen separados. Con pdftoppm, puedse especificar la resolución de imagen preferida, escalar y recortar tus imágenes.
Primero comenzaremos con la instalación de la herramienta para a convertir nuestros archivos PDF a imágenes.
Instalar pdftoppm
Para utilizar la herramienta de línea de comandos pdftoppm, es necesario instalar primero pdftoppm, que forma parte del paquete poppler / poppler-utils / poppler-tools. Instala este paquete de la siguiente manera dependiendo de tu distribución de Linux
$ sudo apt install poppler-utils [En Debian/Ubuntu & Mint]
$ sudo dnf install poppler-utils [En RHEL/CentOS & Fedora]
$ sudo zypper install poppler-tools [En OpenSUSE]
$ sudo pacman -S poppler [En Arch Linux]
A continuación se muestran ejemplos de cómo puedes utilizar la herramienta pdftoppm para convertir tus archivos .pdf en imágenes:
Convertir un documento PDF en una imagen
Pdftoppm convierte archivos de formato de documento portátil (PDF) en archivos de imagen de color en formato Pixmap portátil (PPM), archivos de imagen en escala de grises en formato de mapa de grises portátil (PGM) o archivos de imagen monocromáticos en formato mapa de bits portátil (PBM).
La sintaxis para convertir un pdf completo es la siguiente:
$ pdftoppm -<formato_imagen> <nombre_archivo_pdf> <nombre_imagen>
Para mostrar como se convierte un archivo PDF a imagen con pdftoppm haremos muestra de sus usos básicos y rápidos para que lo puedas hacer tú también.
Lo primero es tener un archivo el cual transformaremos a imágenes, para este ejemplo ya tenemos un archivo PDF, este archivo cuenta con 10 páginas:
Entonces, para este ejemplo, el comando sería el siguiente:
pdftoppm -png Cuentos Infantiles.pdf Imágenes
Al ejecutar el comando anterior, comenzará a convertir cada una de las páginas en imágenes de acuerdo al formato que le hayamos asignado, dependiendo del tamaño del PDF es lo que tardará en completarse.
Para nuestro ejemplo, solo nos generará 10 imágenes con el nombre ‘Imagenes’ asignándoles un número incremental automáticamente para identificar cada página/imagen generada:
Ahora, podemos comprobar que se hayan generado correctamente:
Por supuesto, también podemos generar imágenes con un formato distinto:
$ pdftoppm -jpeg Cuentos\ Infantiles.pdf Imagenes
El resultado deberá ser idéntico, excepto el cambio de formato en la imagen (.JPG).
Convertir un rango de páginas PDF en imágenes
La sintaxis para especificar el rango es la siguiente:
$ pdftoppm -<formato_imagen> -f N -l N <nombre_archivo_pdf> <nombre_imagen>
Donde -f N especifica el número de la primera página a convertir y -l N para la última página a convertir.
Por ejemplo. Convertiremos a imágenes el mismo archivo PDF, pero ahora solo algunas páginas en específico. Esas serán desde la página número 5 y a la número 8 en un formato PNG:
$ pdftoppm -png -f 5 -l 8 Cuentos\ Infantiles.pdf Imagenes
Comprobamos que se haya creado el rango especifico de imágenes que le asignamos:
Otros comandos con pdftoppm
- Para convertir sólo la primera página, utiliza la siguiente sintaxis:
pdftoppm -png -f 1 -l 1 nombre_archivo.pdf nombre_imagen
- Pdftoppm convierte las páginas PDF en imágenes con un DPI de 150 por defecto. Para ajustarlo, utiliza el número -rx que especifica la resolución X, y -ry el número que especifica la resolución Y, en DPI.
$ pdftoppm -png -rx 300 -ry 300 nombre_archivo.pdf nombre_imagen
- Para ver todas las opciones disponibles y soportadas en pdftoppm, ejecuta el comando de ayuda o el comando de manual:
$ pdftoppm --help
$ man pdftoppm
Afortunadamente, ahora puedes convertir tus páginas PDF en imágenes en Linux utilizando la herramienta de línea de comandos Pdftoppm.