Créer un pdf à partir d'un livre HTML

16

Certains sites proposent des livres sous forme de pages HTML (par exemple, des éléments juridiques).

Que puis-je utiliser pour créer un livre PDF à partir de ces pages, sur la base de la structure déjà existante?

Sous Windows, il existe Adobe Professional (logiciel commercial). Je suppose que Linux a quelque chose de gratuit? Une solution impliquant des scripts serait OK pour moi.

Lucian Sasu
la source

Réponses:

9

Calibre est un outil assez puissant pour convertir des choses en livres électroniques dans différents formats. Disponible dans un Software Center près de chez vous!

Ne vous laissez pas tromper par sa moins belle interface utilisateur, cela peut faire beaucoup.

Oli
la source
1
calibre est également livré avec un outil en ligne de commande, ebook-convert. Donc, avec cela, vous pourriez le faire for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; doneet cela convertirait tous les fichiers html du dossier en PDF.
frabjous
1
Ceci est un bon outil, je suis également un utilisateur Calibre, je pense que le dernier a marqué des améliorations dans l'interface utilisateur.
Sabacon
4

La manière la plus simple? Fichier> Imprimer depuis votre navigateur. Sélectionnez Imprimer dans un fichier comme imprimante et il vous demandera où vous le souhaitez. Assurez-vous de marquer le PDF. Appuyez sur "Imprimer" et il sera en fait enregistré sur votre disque au lieu d'imprimer.

Jacob Peddicord
la source
Merci. Il y a cependant beaucoup de fichiers. Cette manœuvre est pratiquement impossible.
Lucian Sasu
4

Htmldoc peut être utile, voyez-le ici; http://www.htmldoc.org/ il est disponible auprès du centre logiciel, malheureusement la version 1.8 a un problème avec les fichiers encodés en unicode mais à de nombreuses reprises il peut toujours être un sauveur, le problème est résolu dans la version de développement 1.9.

J'utilise habituellement la merveilleuse extension de scrapbook ici; http://amb.vis.ne.jp/mozilla/scrapbook/ pour Firefox pour capturer les pages Web, utilisez les outils d'édition dans scrapbook pour les corriger si nécessaire, puis utilisez htmldoc pour convertir toutes les pages au format PDF.

Sabacon
la source
3

Vous pouvez essayer http://www.xhtml2pdf.com/ . C'est un convertisseur pour HTML / XHTML et CSS en PDF. Tout est écrit en Python.

Nichod
la source
3

Je recommanderais d'utiliser OpenOffice / LibreOffice pour créer le PDF. Comme test, j'ai téléchargé le manget Wget (tout en une page), puis ouvert la page HTML dans OponOffice et cliqué sur le bouton "Exporter directement au format PDF". Il a créé le PDF avec un index de la table des matières.

Dans le passé, j'ai trouvé que c'était le moyen le plus simple de convertir des pages HTML en PDF. Il vous permet également d'apporter des modifications sans trop d'effort.

Captures d'écran:

  • Manuel Wget exporté au format PDF à l'aide d'Open Office Manuel Wget exporté au format PDF à l'aide d'Open Office

  • Option d'exportation directe au format PDF dans Open Office Option d'exportation directe au format PDF dans Open Office

SiliconChaos
la source
des idées si le livre n'est pas sur une seule page, mais divisé en plusieurs chapitres / sections?
Ciprian Tomoiagă
2

J'ai en fait voté pour la solution calibre. Mais voici une autre que vous pourriez essayer. Installez AbiWord . Il peut effectuer des conversions entre tous les formats qu'il connaît depuis la ligne de commande. Pour convertir tous les fichiers .html d'un dossier en .pdf, vous pouvez faire:

for file in *.html ; do abiword --to=pdf "$file" ; done

Pour la typographie de niveau supérieur (mais sans doute plus compliqué), une autre option serait PrinceXML .

frabjous
la source
2

Selon le document html à imprimer, vous obtiendrez peut-être les meilleurs résultats avec pandoc . Il s'agit de l'un des convertisseurs HTML vers LaTeX les plus polyvalents. Le fichier .tex résultant peut être converti en PDF assez facilement, en utilisant xelatexou pdflatex. De nombreuses options sont disponibles si vous souhaitez explorer la syntaxe et les packages LaTeX. Cela peut ne pas fonctionner correctement si les images intégrées et les styles HTML sophistiqués doivent être conservés.

Loevborg
la source
1

Dans google-chrome, vous pouvez créer un fichier pdf pour un site entier en utilisant une extension. J'utilise personnellement l' extension Web2PDF Converter qui crée un PDF en un seul clic.

Voici une capture d'écran de ce plugin, fournie par le site de la boutique en ligne d'extensions Google.

entrez la description de l'image ici

De plus, vous pouvez voir un PDF créé par moi avec cet outil, en téléchargeant le suivant (clic droit, enregistrer la cible sous): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (certains navigateurs comme google- Chrome peut vous permettre de voir cela en ligne).

Et si vous souhaitez modifier les PDF créés par l'extension afin de supprimer la signature numérique placée par l'extension au bas de chaque page ou de supprimer quoi que ce soit d'autre, jetez un œil à ceci: Supprimer les informations textuelles d'un PDF?

Bonne chance!

Geppettvs D'Constanzo
la source