Je cherche un bon programme pour me montrer les différences entre deux fichiers pdf similaires. En particulier, je cherche quelque chose qui ne se contente pas de lancer diff sur une version ascii (avec "pdftotext") des fichiers. C'est ce que fait pdfdiff.py .
39
Réponses:
Vous pouvez utiliser DiffPDF pour cela. De la description:
la source
sudo apt-get install diffpdf
.Je viens juste de trouver un moyen de rendre DiffPDF (le programme suggéré par @qbi) utilisable pour des modifications autres que mineures. Ce que je fais est concaténer toutes les pages pdfs dans un long rouleau en utilisant pdfjam et ensuite comparer les parchemins. Cela fonctionne même lorsque de grandes sections sont enlevées ou insérées!
Voici un script bash qui fait le travail:
la source
Même si cela ne résout pas le problème directement, voici un bon moyen de faire tout cela en ligne de commande avec quelques dépendances:
https://linux.die.net/man/1/pdftotext
Cela fonctionne vraiment bien pour les comparaisons de base en pdf. Si vous avez une version plus récente de pdftotext, vous pouvez essayer
-bbox
au lieu de-layout
.Pour ce qui est des programmes, j'aime utiliser diffuse, la commande change donc très légèrement:
http://diffuse.sourceforge.net/
J'espère que ça t'as aidé.
la source
Si vous avez 2 ou 3 énormes fichiers pdf (ou epub ou autres formats, lisez ci-dessous) à comparer, il est possible de combiner la puissance de:
calibre (pour convertir votre source en texte)
meld (pour rechercher visuellement les différences entre les fichiers texte)
parallèle (utiliser tous les cœurs de votre système pour accélérer)
Le script ci-dessous accepte en entrée l’un des formats de fichier suivants: MOBI, LIT, PRC, EPUB, ODT, HTML, CBR, CBZ, RTF, TXT, PDF et LRS.
S'il n'est pas installé, installez alors meld, calibre et parallèle:
Pour pouvoir exécuter le code de n’importe où sur votre ordinateur, enregistrez le code suivant dans un fichier nommé "diffepub" (sans extension) dans le répertoire "/ usr / local / bin".
Assurez-vous que le propriétaire est votre utilisateur et qu'il dispose des autorisations d'exécution:
Pour le tester, tapez simplement:
Je l'ai testé pour comparer 2 révisions d'un pdf de +1600 pages et cela fonctionne parfaitement. Comme calibre est écrit en python pour la portabilité, il a fallu 10 minutes pour convertir les deux fichiers en texte. Lent mais fiable.
la source