Similitude et / ou Diff de deux documents ODT (Linux)

15

J'ai deux documents ODT, ils ont un contenu très proche, je veux les comparer pour voir à quel point ils sont similaires.

Le mieux serait d'avoir un pourcentage de similitude , sinon possible, une alternative serait au moins d'avoir une sorte de diff .

J'utilise Ubuntu Lucid .


Solution:

J'avais l'habitude odt2txtde convertir les fichiers en texte, puis j'avais wdiff -i --statistics one.txt two.txtun diff avec des statistiques qui me donnaient le pourcentage de mots communs (similitude).

Weboide
la source

Réponses:

8

Je ne les ai pas essayés moi-même mais cette paire d'outils - odt2txt et oodiff - semble prometteuse.

JRobert
la source
1
J'ai utilisé odt2txt pour les convertir en texte, puis j'ai utilisé wdiff qui donne un diff par mot.
Weboide
Merci. C'est idéal pour une utilisation dans des systèmes de contrôle de version comme git ou mercurial. Voir les techniques d'intégration / d'automatisation à OpenDocument, diff et révision-contrôle
nealmcb
20

Avez-vous essayé la fonctionnalité de comparaison intégrée? Modifier / comparer le document ...

Si vous voulez juste un diff textuel, votre meilleur pari est probablement de convertir les deux documents en texte brut, puis d'exécuter un diff régulier sur eux. Vous devrez cependant comprendre comment normaliser les sauts de ligne, sinon le diff ne sera pas très utile.

sleske
la source
1
Grande fonction dans LibreOffice, je n'en avais jamais entendu parler! Très utile mais aucune statistique n'est donnée.
stragu
Excellent! Je n'aurais jamais pensé à regarder dans un menu Edition pour comparer des documents. J'ai regardé dans Fichier , Outils et Fenêtre , le dernier étant l'emplacement Word d'uSoft.
wallyk
4
Dans la dernière version, il semble être Edit -> Track Changes -> Compare Document ...
FableBlaze
1

Si vous ne vous souciez pas de la mise en forme du texte, vous pouvez également copier le contenu dans des fichiers en texte brut et utiliser un bon vieux diff.

ps: Êtes-vous un enseignant à la recherche de tricheurs possibles? : p

tamtakos
la source
lol non je ne suis pas professeur mais oui ce serait un bon moyen de chercher des tricheurs :)
Weboide
1

La façon dont je fais cela est de produire des fichiers .pdf avec libreoffice puis d'utiliser diffpdf pour comparer les deux fichiers pdf. Cela montre les différences mises en évidence dans les fenêtres parallèles

Peter Allott
la source