Extraire des images au format PDF sans affecter la résolution?

26

Mon problème est que je suis chargé d'extraire des images d'un fichier PDF de 640 pages.

Dont la majorité sont des graphiques et des tableaux avec des textes. Faire un simple copier-coller fait perdre à l'image sa résolution et les textes deviennent flous et parfois illisibles.

Connaissez-vous une meilleure façon d'extraire des images d'un fichier PDF sans affecter la résolution?

r2b2
la source
2
J'ai résolu cela en installant KDE pour Windows, puis en installant okular .. Dans Okular, on peut sélectionner l'image et l'enregistrer directement dans le fichier en éliminant le processus de collage sur un programme d'édition d'image qui, je pense, préserve en quelque sorte la résolution.
r2b2
Voir la réponse Photoshop ci-dessous et suivez l'étape 4.
George Langley

Réponses:

23

À partir de la suite XPDF (qui est un logiciel gratuit et open source), vous pouvez utiliser l'pdfimages.exeoutil CLI pour extraire toutes les images d'un PDF, ou seulement toutes les images d'une gamme de pages. Voici un exemple pour extraire toutes les images des pages 33-36:

pdfimages.exe ^
  -f 33 ^
  -l 36 ^
  -j ^
   c:/path/to/input.pdf ^
   c:/path/to/directory/input_images

Le -jva essayer d'extraire les images JPEG incorporées en tant que JPEG. Toutes les autres images sont sorties en PPM (pixmaps portables). Attention, les PPM sont totalement non compressés!

Kurt Pfeifle
la source
Fonctionne également à merveille sur Mac! J'ai utilisé la commande de terminal./pdfimages -j PDF_to_be_extracted.pdf /Users/username/output_folder/
Eptin
4

c'est très facile à utiliser evince(la visionneuse de documents) dans Ubuntu. Il suffit d'ouvrir le pdf en utilisant evincepuis de ne pas agrandir la fenêtre, de la marquer Always on toppuis de faire glisser et déposer l'image dans le dossier que vous aimez.

ophidion
la source
Evince est également disponible pour Windows et BSD . Faites également un clic droit sur les offres d'images pour enregistrer sous .
Adobe
1

(1) Vous pouvez ouvrir le fichier dans Word 2013 (utilisez simplement Fichier - Ouvrir), où vous pouvez copier l'image. La résolution est assez bonne pour l'impression, mais je ne sais pas si elle est identique à l'original.

(2) Le visualiseur Freeware SumatraPDF (très bien si vous utilisez LaTeX) a une option de menu "Copier l'image" lorsque vous cliquez avec le bouton droit sur l'image. Je pense que cela préserve la résolution (même si j'ai vu des fichiers à partir desquels je n'ai pas pu copier les images).

(3) Adobe Acrobat X , sous Fichier, a Enregistrer sous Autre - Image, et là, par défaut, il utilise la haute résolution (dans les cas où j'ai essayé, c'était la résolution d'origine).

(4) En Perl , il y a plus d'un moyen, par exemple, lire ici et spécialement mentionné le programme pour extraire les images JPEG de n'importe quoi , qui a parfaitement fonctionné pour moi et extrait définitivement les images JPEG de résolution d'origine.

Alexander Gelbukh
la source
1

PHOTOSHOP! Ouvrez le PDF dans Photoshop. (Utilisation de Photoshop CC sur Windows 7)

  1. Lancez Photoshop.
  2. Sélectionnez Fichier / Ouvrir (ou Commande / Contrôle-O). La boîte de dialogue "Ouvrir" apparaîtra.
  3. Sélectionnez le PDF et cliquez sur OK / Entrée. La boîte de dialogue "Importer PDF" apparaîtra.
  4. IMPORTANT - sous "Sélectionner", cliquez sur le bouton radio "Images". Toutes les images apparaîtront!
  5. Sélectionnez l'image souhaitée et cliquez sur OK.
  6. Ta-da!
George Langley
la source
0

Non - le copier-coller doit conserver la résolution d'origine de la ressource intégrée - ce qui se produit le plus probablement, c'est que c'est une image basse résolution qui a été réduite à l'intérieur du PDF, donc quand elle est exportée, elle a l'air pire qu'elle ne l'est.

Essayez de le réduire et / ou de le rendre de la même taille que dans le PDF et il devrait en fait être le même.

Alternativement, (et pire option), passez à un zoom à 100% et faites une capture d'écran ou utilisez l'outil de capture dans Windows Vista / Windows 7.

REMARQUE - Les images en .PDFs sont généralement réduites / compressées au moment où elles sont converties en a .PDF, cependant, une fois compressé, vous devriez pouvoir extraire avec la même qualité que le PDF, pas pire.

William Hilsum
la source
Cela est particulièrement vrai avec les tables. Peut-être que je dois zoomer sur la résolution souhaitée, ou jusqu'à ce que le texte soit lisible et saisir l'instantané. Une autre option que j'ai est d'ouvrir le pdf dans Gimp et d'augmenter la résolution
r2b2
Pas ce que je vois. Il y a une image haute résolution dans le PDF, mais Acrobat (Pro DC pour Windows) la rééchantillonne à la volée quel que soit le grossissement que vous regardez - je peux aller jusqu'à 600% sur le PDF actuel qui Je travaille avant de voir une pixellisation. Mais le sélectionner et le copier, à n'importe quel grossissement, n'en obtient qu'une version à faible résolution qui ne fonctionne qu'à 100%.
George Langley
0

Quel logiciel de visualisation PDF utilisez-vous?

En utilisant un programme d' édition / création de PDF , comme Adobe Acrobat Pro , vous devriez pouvoir extraire les images incorporées telles qu'elles se trouvent dans le fichier PDF *. Vous pouvez obtenir un essai gratuit sur le site Adobe (pour Windows et Mac), que vous pouvez utiliser uniquement à cette fin.

* tant qu'ils ne sont pas protégés, auquel cas vous devrez .. euh, je n'y vais pas ...

paradroid
la source
Son essai gratuit d'Adobe Acrobat. Je vais essayer ça aussi, merci!
r2b2
1
@ r2b2: Oh, si vous utilisiez déjà Adobe Acrobat Standard, je ne pense pas que l'utilisation de la version Pro va aider.
paradroid
0

Vous pouvez utiliser Imagemagick pour convertir toutes les pages PDF en fichiers image séparés (bien que je ne sois pas sûr du temps qu'il faudra pour faire un si gros document, ou s'il se débrouillera!), Puis recadrez ce que vous voulez. Cela pourrait valoir la peine de faire un essai avec cela, car au moins vous découvrirez si la résolution des images intégrées est correcte pour ce dont vous avez besoin.

Linker3000
la source
0

La meilleure façon est d'utiliser Adobe Acrobat Pro (2010 ou versions plus récentes). Allez dans Fichier -> Enregistrer sous -> Plus d'options -> PostScript encapsulé, puis cliquez sur Enregistrer.

Ali
la source
0

Si vous avez Acrobat pro, c'est de loin le moyen le plus simple de prendre un instantané de haute résolution (définissez-le à la hauteur souhaitée). Dans les préférences / générales, cochez la case qui dit « utiliser une résolution fixe pour l'outil de capture instantanée » et réglez la résolution à votre goût, par exemple 300ppi ou même plus. Ensuite, prenez un instantané (outils / outil de sélection et de zoom / instantané) et il copiera une copie haute résolution dans votre presse-papiers. Ensuite, collez-le depuis votre presse-papiers où vous le souhaitez. fonctionne très bien.

Pour voir une description plus détaillée, cliquez sur ce lien ...

la réponse détaillée de quelqu'un avec des captures d'écran

marque
la source
0

J'extrait généralement des images en ouvrant les fichiers pdf dans Adobe Illustrator, puis en les copiant et en les collant dans InDesign. La résolution se conserve.

Richard
la source
0

Adobe Acrobat Pro

Fichier> Enregistrer sous utilisera les paramètres de conversion à partir de PDF sous "Edition> Préférences"

[Conversion de PDF] permettra [Modifier les paramètres ...] pour chaque format de fichier

Le meilleur dépendra des images sources et de la résolution qui ont été utilisées pour créer le PDF.

Mais vous pouvez obtenir de très bons résultats en modifiant les paramètres TIFF sans perte

Réglez la résolution sur 1200 ou plus (si Save Fails la réglez plus bas), puis utilisez le fichier d'origine> SaveAs pour rendre le fichier PDF en fichiers individuels haute résolution

Ce n'est pas le meilleur moyen, mais vraiment beaucoup mieux que le rendu avec un type de document différent.

Les fichiers seront très gros, mais plus adaptés au copier-coller

jwillis84
la source
0

Sur un Mac, vous pouvez exporter des images ou une page entière à partir d'Aperçu et obtenir la pleine résolution. Il vous sera demandé quelle résolution vous voulez dans une boîte de dialogue.

Lars Finsen
la source
0

Dans Adobe InDesign, vous pouvez utiliser la commande «Placer» pour importer un fichier PDF. Si vous souhaitez importer des pages spécifiques, cochez la case Afficher les options d'importation dans la boîte de dialogue qui apparaît après avoir cliqué sur la commande Placer. Faites glisser et redimensionnez le cadre pour que ce dont vous avez besoin en tant qu’image haute résolution tienne dans la page. Vous devez souvent redimensionner la taille de la page du document en fonction du rapport d'aspect de l'image. Une fois que vous êtes satisfait de ce que vous voyez, utilisez la commande Exporter et sélectionnez PDF de haute qualité. Cela créera un PDF haute résolution que vous pourrez imprimer ou utiliser dans des documents en latex.

athulpg007
la source