Quelqu'un a-t-il des recommandations ou des procédures pour réparer un PDF corrompu? Lorsque j'ouvre le fichier, je reçois le message "Une erreur s'est produite lors de l'ouverture de ce document. Le fichier est endommagé et ne peut pas être réparé." Il semble y avoir une myriade d'outils, mais aucun que je puisse qualifier de réputé. Existe-t-il des solutions Linux open source pour cela?
pdf
repair
ghostscript
Tim Alexander
la source
la source
Réponses:
Ghostscript réparera automatiquement votre PDF corrompu ... s'il peut l'ouvrir (c'est-à-dire s'il n'est pas endommagé au-delà de toute réparation). Mais après, vous aurez encore besoin de vérifier le résultat ...
Sous Linux, essayez cette commande:
Sous Windows, essayez celui-ci:
la source
J'avais un fichier PDF corrompu
print.pdf
que Ghostscript ne pouvait pas ouvrir, mais les visualiseurs graphiques classiques sous Linux (Okular, Evince) s'ouvraient correctement. (Dans mon cas, le fichier avait des ordures au début au lieu d'un en-tête PDF, lorsqu'il était ouvert dans un éditeur hexadécimal.)Ces visualiseurs PDF utilisent Poppler comme moteur de rendu PDF. Vous pouvez donc réparer le fichier PDF à l'aide des outils de ligne de commande de Poppler. Dans Ubuntu, ceux-ci sont dans le
poppler-utils
package. J'ai utilisé:qui a généré un fichier PDF avec des en-têtes corrects, outils tels que Ghostscript maintenant acceptés.
la source
mutool
( page du projet , page de manuel ) réparera les PDF brisés sans les imprimer .sudo apt-get install mupdf-tools
mutool clean input.pdf output.pdf
Alternativement, il existe quelques outils et frameworks qui peuvent décomposer / décompiler des PDF en leurs composants sans les restituer. Celles-ci pourraient être utiles pour extraire du texte, des scripts et des images. Voir cette réponse pour une liste de ces outils: https://reverseengineering.stackexchange.com/q/1526/8210 . Par exemple, vous pouvez essayer la première réponse Origami actuelle , elle dispose d’un visualiseur basé sur GTK.
la source
mutool clean
ne corrige pas toutes les erreurs possibles. J'ai un fichier qui contient diverses erreurs dans les flux de polices et de contenu, et Mutool les conserve.J'avais un fichier pdf corrompu, car le fichier php utilisé pour le télécharger faisait écho à des erreurs (en HTML) et des caractères NUL à la fin.
La solution consistait à ouvrir le fichier PDF avec Notepad ++ et à supprimer tout le texte après la ligne.
la source
%%EOF
. J'ai tout supprimé après le premier en%%EOF
utilisant un éditeur hexadécimal. Maintenant tout fonctionne bien.