J'ai un fichier PDF résultant de la numérisation d'un livre.
Dans ce fichier, 2 pages du livre correspondent à 1 dans le fichier PDF. Ainsi, lorsque je vois une page dans le fichier PDF, je vois en fait deux pages du livre.
( original )
J'aimerais savoir s'il existe un moyen de convertir ce fichier en un autre PDF où 1 page du livre correspond à 1 page du PDF, c'est-à-dire la situation normale.
Vous pouvez utiliser
mutool
un outil de ligne de commande MuPDF (sudo apt-get install mupdf-tools
):Vous pouvez également utiliser
-y
si vous souhaitez effectuer une division verticale.la source
mupdf-tools
(donc ..sudo apt-get install mupdf-tools
).mutool clean input.pdf output.pdf 2-N
Je voudrais utiliser Briss . Il vous permet de sélectionner différentes régions de chaque page, chacune d'entre elles se transformant en une nouvelle page.
la source
Une autre option est ScanTailor . Ce programme est particulièrement bien adapté au traitement de plusieurs analyses à la fois.
apt-get install scantailor
Malheureusement, cela ne fonctionne que sur les entrées de fichier image, mais c'est assez simple pour convertir un fichier PDF numérisé en un fichier jpg. Voici un one-liner que j'ai utilisé pour convertir tout un répertoire de PDF en jpgs. Si un PDF a n pages, il crée n fichiers jpg.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
J'avais des captures d'écran prêtes à être partagées, mais je n'ai pas assez de représentants pour les poster.
ScanTailor affiche le format tif. Si vous souhaitez récupérer les fichiers au format PDF, vous pouvez les utiliser pour créer un fichier PDF pour chaque page.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Ensuite, vous pouvez utiliser ce one-liner ou une application telle que PDFShuffler pour fusionner tout ou partie des fichiers en un seul PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf
la source
Voici un script python pour cela.
https://gist.github.com/tshrinivasan/23d8e4986cbae49b8a8c
la source
Sejda peut le faire en utilisant son interface Web ou son interface de ligne de commande (open source). La tâche s'appelle
splitdownthemiddle
la source
Vous pouvez utiliser okular ou n’importe quel lecteur pdf, puis utiliser print to file et sélectionner des options et des copies-> pages. Sélectionnez les pages qui vous intéressent, puis imprimez. Il coupera les pages sélectionnées. Simple et facile !!
la source
Une solution en ligne de commande utilisant ImageMagick:
Diviser le PDF en images individuelles:
Divisez chaque image de page en une image gauche et droite:
Renommez les
page-###-split-#.png
fichiers juste001.png
,002.png
etc.:Combinez à nouveau les images de page obtenues dans un PDF:
Sources: (y compris les variations et autres astuces)
Couper et séparer le livre en 3 commandes , modifiées ici pour utiliser une
for
commande en boucle afin d’éviter les problèmes de mémoire.Réponse: renommer des fichiers d'un dossier en numéros séquentiels , avec ce commentaire
Réponse: ImageMagick: la conversion est arrêtée après quelques pages , au cas où vous utiliseriez les limites de mémoire d'ImageMagick (ce que j'ai fait).
la source
Il y a un merveilleux programme scankromsator. C'est gratuit et fonctionne assez bien avec le vin. Plus d'informations ici .
la source