Fichier PDF intelligent diff

9

J'ai un document LibreOffice que j'ai converti en PDF à un moment donné en utilisant les capacités intégrées. L'horodatage sur le PDF est plus tard que sur le document de traitement de texte, donc cela a du sens, mais je ne suis pas absolument sûr que le document de traitement de texte produit exactement ce PDF. Le document fait 20 pages, ce n'est donc pas une bonne idée de le vérifier manuellement.

Une possibilité est de refaire le PDF dans un dossier différent puis de faire un diff binaire des deux PDF. Malheureusement, la ligne de commande diffindique que les "fichiers binaires sont différents".

Existe-t-il un "diff binaire intelligent" qui m'aidera à déterminer si la différence est simplement dans les métadonnées ou une telle différence non consécutive?

H2ONaCl
la source

Réponses:

13

En général, c'est une bonne idée de vérifier si la commande + l'extension de fichier correspondent à ce que vous recherchez. diff + pdf résulte en diffpdf .

sudo apt-get install diffpdf

DiffPDF est utilisé pour comparer deux fichiers PDF. Par défaut, la comparaison concerne le texte de chaque paire de pages, mais la comparaison de l'apparence des pages est également prise en charge (par exemple, si un diagramme est modifié ou un paragraphe reformaté). Il est également possible de comparer des pages ou des plages de pages particulières. Par exemple, s'il existe deux versions d'un fichier PDF, l'une avec les pages 1-12 et l'autre avec les pages 1-13 en raison de l'ajout d'une page supplémentaire en tant que page 4, elles peuvent être comparées en spécifiant deux plages de pages, 1 -12 pour le premier et 1-3, 5-13 pour le second. Cela rendra DiffPDF comparer les pages dans les paires (1, 1), (2, 2), (3, 3), (4, 5), (5, 6), et ainsi de suite, à (12, 13).

entrez la description de l'image ici

Source: Ubuntugeek.com .

Rinzwind
la source