Certains sites proposent des livres sous forme de pages HTML (par exemple, des éléments juridiques).
Que puis-je utiliser pour créer un livre PDF à partir de ces pages, sur la base de la structure déjà existante?
Sous Windows, il existe Adobe Professional (logiciel commercial). Je suppose que Linux a quelque chose de gratuit? Une solution impliquant des scripts serait OK pour moi.
software-recommendation
pdf
html
Lucian Sasu
la source
la source
for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; done
et cela convertirait tous les fichiers html du dossier en PDF.La manière la plus simple? Fichier> Imprimer depuis votre navigateur. Sélectionnez Imprimer dans un fichier comme imprimante et il vous demandera où vous le souhaitez. Assurez-vous de marquer le PDF. Appuyez sur "Imprimer" et il sera en fait enregistré sur votre disque au lieu d'imprimer.
la source
Htmldoc peut être utile, voyez-le ici; http://www.htmldoc.org/ il est disponible auprès du centre logiciel, malheureusement la version 1.8 a un problème avec les fichiers encodés en unicode mais à de nombreuses reprises il peut toujours être un sauveur, le problème est résolu dans la version de développement 1.9.
J'utilise habituellement la merveilleuse extension de scrapbook ici; http://amb.vis.ne.jp/mozilla/scrapbook/ pour Firefox pour capturer les pages Web, utilisez les outils d'édition dans scrapbook pour les corriger si nécessaire, puis utilisez htmldoc pour convertir toutes les pages au format PDF.
la source
Vous pouvez essayer http://www.xhtml2pdf.com/ . C'est un convertisseur pour HTML / XHTML et CSS en PDF. Tout est écrit en Python.
la source
Je recommanderais d'utiliser OpenOffice / LibreOffice pour créer le PDF. Comme test, j'ai téléchargé le manget Wget (tout en une page), puis ouvert la page HTML dans OponOffice et cliqué sur le bouton "Exporter directement au format PDF". Il a créé le PDF avec un index de la table des matières.
Dans le passé, j'ai trouvé que c'était le moyen le plus simple de convertir des pages HTML en PDF. Il vous permet également d'apporter des modifications sans trop d'effort.
Captures d'écran:
Manuel Wget exporté au format PDF à l'aide d'Open Office
Option d'exportation directe au format PDF dans Open Office
la source
J'ai en fait voté pour la solution calibre. Mais voici une autre que vous pourriez essayer. Installez AbiWord . Il peut effectuer des conversions entre tous les formats qu'il connaît depuis la ligne de commande. Pour convertir tous les fichiers .html d'un dossier en .pdf, vous pouvez faire:
for file in *.html ; do abiword --to=pdf "$file" ; done
Pour la typographie de niveau supérieur (mais sans doute plus compliqué), une autre option serait PrinceXML .
la source
Selon le document html à imprimer, vous obtiendrez peut-être les meilleurs résultats avec pandoc . Il s'agit de l'un des convertisseurs HTML vers LaTeX les plus polyvalents. Le fichier .tex résultant peut être converti en PDF assez facilement, en utilisant
xelatex
oupdflatex
. De nombreuses options sont disponibles si vous souhaitez explorer la syntaxe et les packages LaTeX. Cela peut ne pas fonctionner correctement si les images intégrées et les styles HTML sophistiqués doivent être conservés.la source
Dans google-chrome, vous pouvez créer un fichier pdf pour un site entier en utilisant une extension. J'utilise personnellement l' extension Web2PDF Converter qui crée un PDF en un seul clic.
Voici une capture d'écran de ce plugin, fournie par le site de la boutique en ligne d'extensions Google.
De plus, vous pouvez voir un PDF créé par moi avec cet outil, en téléchargeant le suivant (clic droit, enregistrer la cible sous): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (certains navigateurs comme google- Chrome peut vous permettre de voir cela en ligne).
Et si vous souhaitez modifier les PDF créés par l'extension afin de supprimer la signature numérique placée par l'extension au bas de chaque page ou de supprimer quoi que ce soit d'autre, jetez un œil à ceci: Supprimer les informations textuelles d'un PDF?
Bonne chance!
la source