J'ai deux documents ODT, ils ont un contenu très proche, je veux les comparer pour voir à quel point ils sont similaires.
Le mieux serait d'avoir un pourcentage de similitude , sinon possible, une alternative serait au moins d'avoir une sorte de diff .
J'utilise Ubuntu Lucid .
Solution:
J'avais l'habitude odt2txt
de convertir les fichiers en texte, puis j'avais wdiff -i --statistics one.txt two.txt
un diff avec des statistiques qui me donnaient le pourcentage de mots communs (similitude).
Réponses:
Je ne les ai pas essayés moi-même mais cette paire d'outils - odt2txt et oodiff - semble prometteuse.
la source
Avez-vous essayé la fonctionnalité de comparaison intégrée? Modifier / comparer le document ...
Si vous voulez juste un diff textuel, votre meilleur pari est probablement de convertir les deux documents en texte brut, puis d'exécuter un diff régulier sur eux. Vous devrez cependant comprendre comment normaliser les sauts de ligne, sinon le diff ne sera pas très utile.
la source
Si vous ne vous souciez pas de la mise en forme du texte, vous pouvez également copier le contenu dans des fichiers en texte brut et utiliser un bon vieux diff.
ps: Êtes-vous un enseignant à la recherche de tricheurs possibles? : p
la source
La façon dont je fais cela est de produire des fichiers .pdf avec libreoffice puis d'utiliser diffpdf pour comparer les deux fichiers pdf. Cela montre les différences mises en évidence dans les fenêtres parallèles
la source