J'ai un PDF contenant une image numérisée d'un document. Je souhaite enregistrer le contenu de ce PDF sous forme d'image afin de pouvoir ensuite l'exécuter via un programme OCR qui accepte uniquement les fichiers de type .jpg, .png et .gif.
Comment enregistrer / convertir ce PDF dans l'un de ces formats d'image?
EDIT: Une façon que j'ai trouvé pour ce faire est de cliquer sur chaque page. Copier dans le presse-papier. Collez sur Paint.net, puis enregistrez. Cependant, cela est lourd car il semble que vous ne pouvez sélectionner qu'une seule page à la fois dans Acrobat Reader.
%d
le nom du fichier de sortie est une variable qui est remplacée par le numéro de page. (Presque certainement des nombres bruts, pas le nombre à l'intérieur du PDF.)Installez Imagemagick . Ouvrez une fenêtre ou un terminal cmd:
La sortie sera 1 fichier jpg pour chaque page de votre pdf, test-0.jpg, test-1.jpg, etc.
la source
density
,depth
et desquality
drapeaux qui peuvent vous aider à optimiser votre sortie. Par exemple:convert -density 300 -depth 8 -quality 85 a.pdf a.png
Plus d'infosIl y a aussi
pdfimages
des outils Xpdf (disponibles sur le site de XpdfReader ). Il ne convertira pas une page PDF entière en une image, il extraira plutôt des images incorporées d'un PDF.Ceci est utile si le PDF contient du texte et des images et que vous ne souhaitez que les images. De plus, il extraira les images dans leur format d'origine, donc aucune perte de qualité n'est impliquée (contrairement aux programmes qui rendent la page entière puis la convertissent par exemple en JPEG). Selon vos besoins, cela peut être utile.
Utilisation simple:
Cela va lire le fichier d'entrée
mydocument.pdf
, extraire toutes les images et les écrire dans des fichiers individuels nommésmydocument-images-0000.jpg
,mydocument-images-0001.jpg
etc.L'option
-j
permet d'écrire des images compressées JPEG intégrées sous forme de fichiers JPEG, et non sous forme de fichiers PBM / PGM / PPM (qui sont non compressés et volumineux). Notez que les images peuvent toujours être écrites en tant que fichiers PBM / PGM / PPM, si c'est ainsi qu'elles ont été stockées dans le fichier d'entrée PDF.la source
pdfimages -j "yourinputfile.pdf" "outputimages"
faire "outputimages-0000.ppm" (ou "outputimages-0000.jpg" si elles sont au bon format). Des exemples .NET peuvent être greffés d' ici ou d' iciVous pouvez le faire à l'aide d'Adobe Reader:
la source
À l'exception de la réponse mentionnant pdfimages, toutes les autres réponses ne mentionnent pas que leurs solutions transcodent réellement les images incorporées. C'est-à-dire que ces solutions ne se contentent pas d'extraire l'image originale, mais de la modifier, éventuellement au détriment de l'image, au cours du processus. Seul pdfimages extrait l'image d'origine. C'est le cas de Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview et la plupart des autres logiciels PDF.
la source
PDFill PDF Tools est probablement le moyen le plus simple de convertir vos PDF en images sous Windows. Il vous permettra d'exporter toutes les pages du PDF pour séparer les images en une seule fois. Il a également de nombreuses autres fonctionnalités disponibles gratuitement, qui ne sont disponibles dans d'autres visualiseurs PDF que si vous achetez la version commerciale ou "Pro".
Utilisez le bouton "Convertir le PDF en images" (bouton # 10) dans la capture d'écran ci-dessous.
Si vous avez besoin de concaténer les images en une seule image très haute afin de n'avoir à alimenter qu'un seul fichier dans votre programme OCR, vous pouvez utiliser IrfanView
la source
Puisque vous n'avez pas inclus de balise OS, je vais inclure une réponse OSX:
Les fichiers PDF par défaut s'ouvrent dans Preview.app qui vous permet d'utiliser
File -> Save-As
:la source
Aussi PDF XChange Viewer (Free) fera à l' exportation fichier. Fichier → Exporter → Exporter vers l'image.
Non seulement cela, mais je pense que c'est le meilleur visualiseur PDF gratuit pour Windows, et il a de belles capacités de balisage. J'ai une licence pour Adobe Acrobat et je préfère toujours cela, sauf si je fais des modifications approfondies, ce qui est rarement le cas.
la source
(Non-gratuit) Acrobat Professional fait ceci:
Avancé-> Traitement des documents-> Exporter toutes les images ...
la source
Si le fichier est inférieur à 5 Mo et que vous n'êtes pas inquiet au sujet de la confidentialité / confidentialité, alors il existe un service en ligne pratique à http://www.go2convert.com/ qui peut faire beaucoup de conversions graphiques (y compris pdf en jpeg)
la source
Si l'image dépasse la taille de votre écran, vous pouvez utiliser FastStone Capture (la fonction "Capture Scrolling Window") et enregistrer l'image au format JPEG.
la source
Vous pouvez consulter cet article .
Il répertorie 6 façons différentes de convertir le pdf en images.
Convertir un PDF en JPG (The Web Way)
Convertisseurs PDF en JPG pour le bureau
la source