Avant de commencer à utiliser Ubuntu, j'utilisais Nitro PDF Reader pour extraire automatiquement les images à partir de fichiers PDF. Existe-t-il un lecteur PDF pour Linux?
J'aimerais pouvoir extraire des images plus rapidement / plus facilement que lors d'une prise de vue instantanée.
pdfimages
-on faire mieux / pire que NitroPDF?Réponses:
Utilisation
pdfimages
pdfimages
est un outil d’extraction d’images PDF qui enregistre les images dans un fichier PDF au format de fichier PPM, PBM, JPEG ou JPEG 2000.C'est une partie du
poppler-utils
paquet que vous devrez installer.Usage:
pdfimages [options] <PDF-file> <image-root>
Exemple: Ce qui suit extrait toutes les images d'un fichier PDF et les enregistre au format JPEG.
Sauvegarde les images du fichier PDF
in.pdf
dans des fichiers/tmp/out-000.jpg
(ou/tmp/out-000.pbm
voir ci-dessous)/tmp/out-001.jpg
, etc.La page de manuel de pdfimages explique:
la source
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
commutateur est uniquement pris en charge dans les révisions récentes de poppler-utils. Par exemple, si vous êtes toujours sur 12.04, vous ne pourrez pas accéder à cette option-all
optez pour les formats PNM. Elles sont sans perte et vous pouvez post-traiter les images, par exemple, au format PNG.$ pdfimages -list <PDF-file>
pour vérifier le format d'origine dans la colonne "enc", de sorte que vous n'ayez pas à recoder l'image dans un autre format.J'utilise souvent Inkscape pour cela. Chargez la page et supprimez tous les autres éléments. L’avantage est que vous pouvez obtenir des images vectorielles au format SVG et les modifier à votre guise.
la source
J'ai un fichier PDF à double colonne avec des images incorporées créées avec LaTeX où les images originales ont été fournies au format EPS. J'ai essayé la solution proposée basée sur
pdfimages
, mais malheureusement, elle n'a renvoyé aucune image. J'ai alors essayé d'utiliser Inkscape, mais les images SVG qu'il générait étaient déformées et je n'ai pas eu la chance de les exporter au format EPS.Le logiciel qui a fonctionné pour nous était le MasterPdfEditor .
Voici la procédure
Le résultat est de très haute qualité, mais le logiciel n’est pas gratuit. Il existe une version de démonstration qui "vous permet d'essayer toutes les fonctionnalités", mais vient avec "l'ajout d'un filigrane sur le fichier de sortie". Pour être franc, je n'ai pas remarqué de filigrane dans le fichier PDF produit.
la source
Vous pouvez également essayer pdfmod. C'est une interface graphique (GUI) qui permet d'extraire des images et d'effectuer d'autres manipulations de base en pdf.
la source
Si vous avez besoin d’une image recadrée au format PDF / EPS, extrayez une page avec l’image en utilisant
pdfmod
(comme suggéré par Tâches).Ensuite,
pdfcrop
vous pouvez le recadrer correctement en définissant les marges par essais et erreurs:la source
J'utilise pdfimages, un outil de ligne de commande qui fonctionne très bien pour moi. Il est très facile à utiliser et vous pouvez utiliser l'option --help pour en savoir plus sur son utilisation. J'utilise Ubuntu et il est pré-installé. Si vos fichiers pdf sont cryptés ou protégés par un mot de passe, il existe des options pour cela, donc cet outil fonctionne très bien. Vous pouvez en savoir plus sur pdfimages ici
la source
Avec pdfimages, l'image extraite peut être en deux parties ou plus. Un moyen simple de les réassembler sans vous soucier des formats extraits consiste à importer les pièces dans LibreOffice Draw, à les rogner à l'aide du dialogue de rognage d'image, à les positionner, à ajuster la taille de la page et à l'exportation dans le format de votre choix.
la source
Si vous souhaitez recadrer une image à partir d'un pdf avec un pdfviewer, vous pouvez essayer okular. Il peut rogner n'importe quoi (textes ou images) au format png ou jpeg. Si vous souhaitez extraire des images au format png à partir d'un fichier PDF, vous pouvez le faire avec une commande minimale avec pdftohtml. Il convertit le pdf en html plus des images. Ici vous pouvez trouver un exemple - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Si vous souhaitez extraire de nombreuses images d'un fichier PDF, je vous suggère d'essayer.
la source
Logiciels utilisés: OS Xreader: Antergos
Pas:
la source