Convierte páginas web a PDF en tu terminal Linux con wkhtmltopdf

Escrito por Sergio De Luz
GNU Linux
0

En muchas ocasiones nos puede surgir la necesidad de descargarnos una página web para posteriormente verla offline, normalmente la descarga de webs hace que los archivos sean los propios de una página web con extensiones .html y además se incorporan las fotografías por otro lado. Una alternativa es instalar un plugin en nuestro navegador Firefox o Chrome que realice este trabajo pero que lo pase a un formato mucho más amigable como PDF. Hoy os presentamos una herramienta para convertir fácilmente páginas web en archivos PDF usando únicamente tu terminal de Linux.

La herramienta wkhtmltopdf nos permite descargarnos una página web y exportar todo su contenido a un archivo PDF que crea automáticamente después de su descarga, de esta forma podremos leer de forma offline nuestra web favorita desde cualquier smartphone o tablet con tan sólo abrir un PDF. Esta herramienta es gratuita y está disponible para todos los sistemas operativos Unix como FreeBSD y Linux como Debian (y derivados), OS X y también CentOS entre otras muchas distribuciones. Asimismo wkhtmltopdf también se puede descargar para sistemas operativos Windows desde su página web oficial.

Instalación

Nosotros hemos probado esta herramienta en nuestro sistema operativo de pruebas Kubuntu, para instalarlo únicamente debemos buscar en los repositorios oficiales este software:

sudo apt-get install wkhtmltopdf

La instalación apenas ocupa 100KB de tamaño, y la instalación es muy rápida, a continuación se puede ver el paquete que se instala:

wkhtmltopdf_instalacion

Funcionamiento de wkhtmltopdf

El funcionamiento de esta herramienta es realmente sencillo, para descargar la portada de RedesZone.net en nuestro escritorio tan sólo hace falta ejecutar el siguiente comando a través de terminal:

wkhtmltopdf www.redeszone.net /home/bron/Escritorio/redeszone.pdf

De forma general debemos ejecutar:

wkhtmltopdf WEB RUTA

A continuación tenéis una captura de pantalla del proceso:

wkhtmltopdf_uso

Una vez descargada la página web en PDF podremos abrir el archivo PDF con nuestro visor de PDF:

wkhtmltopdf_pdf_generado

Todas las opciones de wkhtmltopdf

Esta herramienta posee una sencilla ayuda desde la que podremos acceder a más opciones y no sólo a descargar una web en PDF, la orden que debemos introducir será la siguiente:

wkhtmltopdf --help

Como se puede ver en la siguiente captura de pantalla, podremos seleccionar el tamaño de las hojas del PDF, la orientación del mismo, introducir una clave de autenticación si la página web a la que queremos acceder está restringida e incluso usar un proxy para proceder a su descarga.

wkhtmltopdf_ayuda

¿Por qué usar esta herramienta y no los plugins para los navegadores?

Gracias a que esta herramienta se ejecuta a través del terminal, podremos guardar página web en PDF desde equipos que no tienen una interfaz gráfica y mucho menos un navegador, como por ejemplo servidores. Asimismo también podremos programar la descarga de páginas haciendo uso de cron.

Os recomendamos visitar la página web oficial donde encontraréis todos los detalles sobre esta gran herramienta.