Comment convertir un fichier .pdf dans un dossier d'images?

16

J'ai des fichiers .pdf que je voudrais convertir dans mon format de lecture préféré, .cbr ou .cbz ou, si ce n'est pas directement possible, je dois extraire toutes les pages du .pdf sous forme d'images, puis les compresser en mon format de choix. Je n'ai pu enregistrer les pages qu'une par une avec Document Viewer. Évidemment, j'aimerais le faire un peu plus rapidement. J'ai essayé pdfsam, pdf shuffler et pdfmod sans succès. J'utilise Ubuntu 11.10.

Shawn
la source

Réponses:

14

D'accord, j'ai fait quelques recherches supplémentaires et bien que la méthode de tohuwawohu fonctionne, j'ai trouvé plus facile d'utiliser un programme appelé pdftoppm pour réaliser ce que je voulais faire. Étant donné que je suis à peu près un profane en ce qui concerne l'utilisation des applications en ligne de commande, je ferai de mon mieux pour expliquer comment j'ai réussi à faire en sorte que cela fonctionne pour moi.

  1. Accédez au dossier contenant le .pdf que vous souhaitez modifier et ouvrez-y un terminal. J'ai fait cela en utilisant l'exemple de commande:

    cd ~/Documents/PDF
    
  2. Supposons que le fichier que je souhaite modifier s'appelle Sample.pdf. Ce que je veux faire, c'est utiliser pdftoppm pour créer des fichiers image de chaque page du .pdf. Plusieurs formats peuvent être choisis (voir le lien des pages de manuel ci-dessus) mais je préfère utiliser .png. La commande de base ressemble à ceci:

    pdftoppm -FORMAT FILENAME.pdf PREFIX
    

    ou dans l'exemple ci-dessus:

    pdftoppm -png Sample.pdf Sample
    

    Cette commande crée un fichier image de chaque page dans le même dossier que le fichier .pdf d'origine avec des noms comme Sample-01.png, Sample-02.png et ainsi de suite. Je l'ai essayé avec succès avec les extensions .png et .jpeg. .jpg n'est apparemment pas pris en charge.

  3. Ensuite, j'utilise simplement Archive Manager en sélectionnant tous les fichiers image nouvellement créés, en cliquant avec le bouton droit et en choisissant "Compresser" dans le menu contextuel. Je choisis ensuite le format d'archive que je préfère (dans ce cas .cbz ou Comic Book Zip) et crée la nouvelle archive.

  4. J'ai maintenant un nouveau fichier .cbz brillant appelé Sample.cbz que je peux ensuite visualiser avec mon lecteur Comix !

J'espère que ce que j'ai publié ci-dessus est suffisamment logique pour que quelqu'un d'autre puisse en tirer des leçons. Si je dois le modifier de quelque manière que ce soit, faites-le moi savoir.

Shawn
la source
Très agréable! Il semble pdftoppmen fait plus facile à utiliser que celui d'ImageMagick convert.
tohuwawohu
oui c'est très utile et facile. Je veux juste savoir. peut ajouter un préfixe alpha. Comme préfixe-a, préfixe-b, préfixe-c, de cette façon
Pankaj Badukale
pdftoppmest extrêmement lent et utilise toute la RAM de mon ordinateur. pdfimages -jfonctionnait beaucoup mieux.
Eric Duminil
4

Je ne connais pas très bien * .cbr / * .cbz, mais il semble que vous devrez combiner deux étapes:

  1. Conversion de PDF en images
  2. Compressez-les dans une archive ZIP / RAR.

Concernant l'étape 1, vous pouvez utiliser la commande ImageMagickconvert . Vous pouvez alimenter convertavec un PDf comprenant plusieurs pages et convertretourner chaque page sous forme de fichier graphique unique. Je l'ai testé avec un texte numérisé à 400 dpi, et la commande suivante a donné de jolis JPGE simples:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpeg

(crédits concernant l' -qualityoption: cette entrée sur le forum )

En conséquence, vous obtenez 000.jpeg, 001.jpeget ainsi de suite. Il suffit de les compresser dans un .cbzfichier et vous avez terminé.

Vous pouvez même combiner les deux étapes en les «concaténant»:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpg && zip -vm comic.cbz *.jpg

(assurez-vous qu'il n'y a pas d'autre JPEG dans votre répertoire de travail actuel, car en utilisant le code ci-dessus, zip déplacera tous les JPEG dans le fichier cbz)

tohuwawohu
la source
4

J'ai écrit un script bash simple à cet effet, vous aurez besoin de poppler installé, donc:

sudo apt-get install poppler-utils #ubuntu
brew install poppler # mac

Voici le script bash (enregistrez-le sous convert_to_cbz.sh):

filename="${1%.*}"
echo "Converting $filename to cbz"
mkdir "./$filename"
pdftoppm -jpeg "$1" "./$filename/000"
zip -r9 "${filename}.cbz" "./$filename" 
rm -rf "./$filename"

Pour utiliser le script bash:

chmod +x convert_to_cbz.sh
./convert_to_cbz.sh "Nintendo Official Magazine 066 (OldGameMags).pdf"

J'espère que cela sera utile pour quelqu'un!

Alasdair Morrison
la source
Merveilleux, merci. J'ai cependant dû changer un peu le script. pdftoppmutilisé toute ma RAM et planté mon ordinateur. Remplacer la 4ème ligne par pdfimages -j "$1" "./$filename/000" fait l'affaire. Cela fonctionne bien, c'est rapide, il ne semble pas y avoir de perte de qualité et le cbz est légèrement plus petit que le pdf d'origine. pdfimagesest également inclus dans poppler-utils.
Eric Duminil
3

Essayez d'utiliser calibre pour convertir directement le .pdf en .cbr ou .cbz.

bntser
la source
Merci pour la suggestion, mais pour moi, utiliser Calibre comme solution ne fonctionnera pas. J'ai installé le programme et je suis désolé de dire qu'il ressort comme un pouce endolori sur mon bureau! En outre, j'ai découvert que l'utilisation de la commande pdftoppm ci-dessous était bien plus rapide que l'installation et la configuration de Calibre avant la conversion.
Shawn
@ Shawn Oui, je dirais que Calibre est moche et lent, mais il fait le travail. Je suis heureux que vous ayez trouvé une meilleure solution, cependant :)
bntser
1

Il semble que la façon la plus simple d'utiliser Acrobat Pro.

  1. Ouvrez le PDf dans Acrobat Pro.
  2. Une fois le fichier ouvert, allez dans FileExportImageJPEG, il exportera chaque page en un seul JPG.
  3. Placez tous les JPG dans un dossier
  4. Compressez le dossier.
  5. Modifiez manuellement l'extension à la fin du fichier compressé de .zip à .cbz

Si vous préférez un fichier CBR , rar le dossier au lieu de le zipper, puis changez l'extension de .rar en .cbr .

Eric Vincent
la source