J'ai besoin de traiter certains fichiers PDF. La tâche consiste à échanger un fichier image donné par un autre. Mon premier problème est de savoir comment remplacer une image PDF à partir de la ligne de commande dans un processus par lots. Ensuite, j'essaierai de résoudre d'autres problèmes, comme la façon d'identifier l'image à remplacer (car les fichiers PDF peuvent contenir plusieurs images). Mais je veux d'abord résoudre le premier problème: comment remplacer une image dans un PDF par une autre.
J'ai lu sur poppler-utils et pdftk mais pour autant que je sache, aucun de ces outils ne permet de remplacer des images en PDF.
command-line
pdf
images
Ivan
la source
la source
Réponses:
OK ... Je pense que
pdflatex
c'est la pièce manquante ici.Le PO a déclaré qu'il avait examiné
poppler-utils
etpdftk
. Permettez-moi d'ajouter à celapdfimages
. Ces éléments, ainsi quepdflatex
les éléments d'une solution.Dans l'exemple de code ci-dessus,
pdfimages
examine les pages 4 à 20target.pdf
et extrait toutes les images dans des fichiers dont le nom commenceimageroot
.poppler-utils
fournitpdftotext
. Je recommande l'-layout
option qui fait un excellent travail en gardant le document lisible par l'homme.L'objection du PO à la
imagemagick
solution proposée par pidosaurus est qu'une image n'a pas de texte extractible. Avec les utilitaires que j'ai décrits, l'OP aura désormais toutes les images ainsi que tout le texte extrait, et les numéros de page et le contenu sont conservés par l'-layout
option. L'OP pourrait identifier la bonne page de texte et la placer dans un.tex
fichier qui se termine par une%includegraphics
directive et fait référence à l'image de remplacement par nom de fichier. Vous avez ensuitepdflatex
cela et vous vous retrouvez avec un nouveau .pdf d'une seule page à insérer dans le reste de votre documentpdftk
. Si vous saviez où dans le texte de la page d'origine l'image résidait, vous pouvez%includegraphics [h]
et obtenir l'image exactement au bon endroit.la source