J'ai un fichier PDF de 72,9 Mo que je dois réduire à moins de 500 Ko.
Le fichier était une image JPEG que j'avais scannée puis convertie au format PDF.
pdf
compression
tamimym
la source
la source
pdfopt
sa syntaxe est simple et il améliore le chargement et la vitesse de rotation des pages à l'ère iPad. :-)Réponses:
aking1012 a raison. Avec plus d'informations sur d'éventuelles images intégrées, hyperliens, etc., il serait beaucoup plus facile de répondre à cette question!
Voici quelques solutions de script et de ligne de commande. Utilisez comme bon vous semble.
la source
Utilisez la commande ghostscript suivante :
-dPDFSETTINGS=/screen
qualité inférieure, taille plus petite. ( 72 dpi )-dPDFSETTINGS=/ebook
pour une meilleure qualité, mais des pdfs légèrement plus grands. ( 150 dpi )-dPDFSETTINGS=/prepress
sortie similaire au paramètre "Prepress Optimized" d'Acrobat Distiller ( 300 dpi )-dPDFSETTINGS=/printer
sélectionne une sortie similaire au paramètre "Imprimer optimisé" d'Acrobat Distiller ( 300 dpi )-dPDFSETTINGS=/default
sélectionne la sortie destinée à être utile pour une grande variété d'utilisations, éventuellement au détriment d'un fichier de sortie plus volumineuxla source
screen
paramètre était de qualité tropebook
médiocre pour moi, mais qu'il fonctionnait bien, réduisant à 3,6 Mo un fichier PDF numérisé de 33 Mo et le rendant très lisible. Milan.kupcevic.net/ghostscript-ps-pdf est une autre-dPDFSETTINGS
option. Vous pouvez les inclure dans cette réponse.Ma manière préférée de faire ceci est de convertir le pdf en ps et en arrière. Cela ne marche pas toujours, mais quand ça marche, les résultats sont bons:
Cela fonctionne aussi directement sur les pdf, comme suggéré dans les commentaires.
Certains utilisateurs signalent également plus de succès lorsqu’ils utilisent les paramètres du livre électronique comme suit:
la source
ps2pdf intput.pdf output.pdf
Si vous avez un pdf avec des images numérisées , vous pouvez utiliser
convert
pour créer un pdf avec compression jpeg (vous pouvez utiliser cette méthode sur n’importe quel pdf, mais vous perdrez toutes les informations textuelles).Par exemple:
Ajustez la densité (par exemple 100x100) et la qualité à vos besoins.
En fonction de votre entrée, la compression JPEG peut ne pas être le meilleur choix en raison d'artefacts de compression. Vous avez le choix entre BZip, Fax, Groupe4, JPEG, JPEG2000, Sans perte, LZW, RLE ou Zip comme méthodes de compression alternatives (certaines n'autorisant que les images en noir et blanc). Pour plus de détails voir ici .
J'ai pu obtenir d'excellents taux de compression pour les documents numérisés / photographiés (en fonction des paramètres). Selon la source du document, vous souhaiterez peut-être réduire le nombre de couleurs (
-depth
argument).la source
pdfimages input.pdf pages
pour extraire les fichiers pbm, alors vous pouvez faire quelque chose comme:for page in *.pbm; do convert $page -compress Group4 -type bilevel TIFF:- | convert - output.pdf
. Toute OCR sera alors perduepdfsandwich output.pdf
, ce qui semble réduire encore plus la taille du fichier.gs
les coulisses.--density --quality --compress
vs-density -quality -compress
.-resize 50%
également l' ajouter , modifiez le pourcentage en fonction de la quantité de DPI utilisée lors de la numérisationJ'avais besoin de réduire la taille d'un PDF contenant des numérisations couleur d'un document. Chacune de mes pages était une image en couleur dans la mesure où le fichier était concerné. C'étaient des images de pages contenant du texte et des images, mais elles ont été créées en numérisant une image.
J'ai utilisé une combinaison de la commande ghostscript ci-dessous et une d'un autre thread.
Cela a réduit la résolution de l'image à 150 ppp, réduisant de moitié la taille de mon fichier. En regardant le document, il n'y avait presque aucune perte notable de qualité d'image. Le texte est toujours parfaitement lisible sur mon Nexus7 2012.
la source
Voici un script pour réécrire des fichiers PDF numérisés:
Vous pouvez le personnaliser un peu pour le rendre plus réutilisable, mais si vous n’avez qu’un seul
$1
fichier PDF, vous pouvez simplement le remplacer par votre nom de fichier pdf et le placer dans un terminal.la source
J'utilise habituellement ps2pdf pour ce faire (syntaxe plus simple), quelque chose comme ceci:
J'utilise le script python suivant pour réduire la taille de tous les fichiers pdf d'un répertoire d'un serveur de production (8.04). Donc ça devrait marcher.
la source
Cela aura un bon résultat.
la source
Le meilleur pour moi était
D'autres moyens:
Cordialement
la source
pdf2ps input.pdf temp.ps && ps2pdf14 temp.ps output.pdf && rm temp.ps
Je viens de rencontrer ce problème moi-même. Si vous utilisez une numérisation simple, sélectionnez le mode texte pour les numérisations à basse résolution. Vous n'aurez plus à vous soucier de la ligne de commande. Je dis juste.
la source
Contrôler la qualité de la compression:
la source
shift
. Le premier paramètre est le fichier d'entrée, le second est le fichier de sortie et le reste des paramètres est passégs
tel quel.Comme ce lien était le premier pour moi lorsque j'ai effectué une recherche dans Google, j'ai pensé ajouter une possibilité supplémentaire. Aucune des solutions ci-dessus ne fonctionnait pour moi sur un fichier PDF exporté d'Inkscape (15 Mo), mais j'ai enfin pu le réduire à 1 Mo en l'ouvrant dans GIMP et en l'exportant à nouveau au format PDF.
Une autre option proche (mais le texte était un peu flou) était l'utilitaire de conversion d'ImageMagick:
la source
convert -compress Zip
sembliez rasterise tous les vecteurs.En fin de compte, j'ai écrit mon propre script bash pour résoudre ce problème, il utilise
mogrify
,convert
etgs
pour extraire des pages de pdf comme .png, les redimensionner, les convertir en 1 bit bmp puis les reconstruire en format pdf. La réduction de la taille du fichier peut être supérieure à 90%. Disponible à l' adresse http://www.timedicer.co.uk/programs/help/pdf-compress.sh.php .la source
Je recommande fortement pdfsizeopt .
Il est beaucoup plus efficace en termes de réduction de la taille que l' un des anciens logiciels CLI et GUI que j'ai essayé (y compris
convert
,gs
,pdftk
, etc.) - mais peut - être plus lent avecpngout
activé -, et ne dispose pas certains de leurs problèmes (pas très images pixélisées / dégradées, pas de perte de marque-pages, etc.).Maintenant, si vous devez atteindre une certaine taille quelles que soient les conséquences (y compris la dégradation des images jusqu'à un point d'illisibilité), il ne s'agit peut-être pas de l'outil dont vous avez besoin, mais en tant que solution évolutive pour réduire les grandes tailles inutiles Dans les PDF sans perdre en lisibilité, en information et en qualité d'image acceptable, je pense que c'est la meilleure option. (Remarque: j'ai tendance à l'utiliser après avoir d'abord effectué une OCR de vectorisation dans Adobe Acrobat [cette fonction s'appelait auparavant "CleanScan"], ce qui peut avoir un impact dramatique sur la taille de certains documents texte numérisés.)
Je recommande l' installation Unix générique :
Installez toutes les dépendances requises:
Téléchargez et installez l'exécutable:
Usage:
Note pour les utilisateurs de Mac ayant trouvé ce post (ou les utilisateurs de Linuxbrew): il existe une formule d'installation Homebrew:
la source
Je faisais face au même problème et j'étais heureux de trouver ce fil. Plus précisément, j'avais un fichier PDF généré à partir d'images numérisées et j'avais besoin de réduire sa taille en octets d'un facteur 6.
Malheureusement, aucune des solutions ci-dessus n'a fonctionné :(. Ensuite, j'ai réalisé que quelque part dans le processus de numérisation-> jpeg-> pdf, la taille de la page avait été gonflée d'un facteur de 4 environ. Les documents scannés étaient tous de format Lettre, mais le pdf avait la taille de
J'ai finalement obtenu les résultats souhaités avec une commande "convertir" qui redimensionnait et compressait en une étape:
Notez que doc_orig avait une densité de 72x72 dpi.
la source
Si la conversion en djvu serait également acceptable et si aucune couleur n'est impliquée, vous pouvez essayer les solutions suivantes:
Convertissez le pdf en jpg en utilisant
pdfimages -j
Si vous obtenez des fichiers pbm à la place, vous devez effectuer l'étape intermédiaire:
for FILENAME in $(ls *.pbm); do convert $FILENAME ${FILENAME%.*}.jpg ;done
La commande convert provient du paquet imagemagick.
Ensuite, utilisez scantailor pour en faire des tif.
Dans une dernière étape, vous allez dans le répertoire des scantailors out (où sont situés les tif) et appliquez djvubind à ce répertoire.
Cela devrait réduire considérablement la taille du fichier sans perte importante de qualité du texte. Si vous voulez un contrôle plus précis du back-end d'ocr, vous pouvez
djvubind --no-ocr
utiliser ocrodjvu pour ajouter la couche ocr par la suite.Si vous avez de la couleur dans votre document, les choses se compliquent un peu. Au lieu de djvubind, vous pouvez utiliser didjvu et, dans Scantailor, vous devez passer en mode mixte et sélectionner parfois les images couleur manuellement.
la source
charger une image ou même un fichier pdf dans inkscape.
À partir d’Inkscape: enregistrez au format vectoriel (en tant que fichier .svg natif).
Importez des fichiers vectoriels dans scribus, modifiez la mise en page et exportez / enregistrez au format .pdf à partir de là.
la source
Outil de compression PDF très simple: page GitHub.
Installation sur Ubuntu:
Il utilise ghostscript.
la source
Vous pouvez essayer ceci:
Il est plus rapide
gs
mais compresse jusqu’à 30% dans ce cas pour un fichier d’entrée de 107.5MiB.la source
Pour moi, l'
screen
option gs était trop mauvaise etebook
trop grande.Mon document original contenait du texte sous forme d'images couleur et noir et blanc (selon la page).
La meilleure solution que j'ai trouvée a été:
Notez que le niveau de compression n’est pas linéaire. Si j’ai spécifié 135, il n’a pas été compressé, mais 130 a été (dans mon cas) la résolution maximale permettant d’obtenir une compression.
la source
J'ai utilisé les commandes ci-dessous mais il n'a pas compressé mon fichier pdf de manière substantielle. Parfois, une partie de la portion était noircie après compression.
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf $INPUTFILE
"ps2pdf -dPDFSETTINGS=/ebook %s %s" % (input_file_path, out_file_path)
Après avoir trop erré sur le Web, je ne trouvais tout simplement pas la bonne bibliothèque de compression. Je suis venu à travers
pdfcompressor.com
. C'est juste un site génial. Il compresse le pdf de 95% (15 Mo de fichiers). J'ai donc utilisé le sélénium et Tor pour automatiser la compression. Commander mon dépôt Github. [GITHUB] ( https://github.com/gugli28/PdfCompressor )la source