HTML récursif en PDF

12

J'ai un dossier avec cette structure:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

avec de nombreux sous-dossiers et uniquement des fichiers html ... je veux tous les convertir en pdf en utilisant une seule commande ou un script simple qui ne nécessite pas tous les noms de fichiers.

En connaissez-vous un

Matteo Pagliazzi
la source

Réponses:

15

Je suggérerais d'installer l'outil WKHtmlToPDF à partir de http://wkhtmltopdf.org/ (déplacé de: http://code.google.com/p/wkhtmltopdf/ ).

Vous pouvez ensuite passer au dossier racine et utiliser find et xargs pour les convertir:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Cela va ensuite créer un PDF avec chaque fichier HTML.

dan_linder
la source
j'ai résolu avec une liste de fichiers et un bash pour mais c'est beaucoup mieux!
Matteo Pagliazzi
5

La commande suivante devrait faire le travail pour un lien:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Pour plusieurs liens, il ne devrait pas être difficile d'écrire une boucle qui gère chaque lien un par un.

jcollado
la source