J'ai beaucoup de fichiers à trier; et malheureusement, il y a beaucoup de fichiers avec le même nom mais un contenu différent, et il y a le même contenu avec des noms de fichiers différents.
Je pense à utiliser md5sum
pour générer des sommes de contrôle pour les fichiers, mais je dois savoir - est-il possible que deux fichiers différents (c'est-à-dire un contenu différent) génèrent la même somme de contrôle?
Si tel est le cas, quelle est la probabilité que cela se produise?
Serait-il possible d'utiliser deux programmes de somme de contrôle non liés (c.-à-d. Ne faisant pas partie de la même "famille") pour générer deux sommes de contrôle - en supposant que, bien que deux fichiers différents puissent générer la même somme de contrôle pour l'un ou l'autre des programmes de somme de contrôle, cela n'arriverait jamais aux deux à la fois?
Réponses:
Deux fichiers avec le même contenu mais des noms de fichiers différents: ( fichier1 et fichier2 ):
Deux fichiers avec des contenus différents mais les mêmes noms de fichiers: ( fichier1 et fichier1 )
Depuis l' entrée wiki ,
Mais, l' algorithme MD5 a ses propres défauts.
Je recommanderais d'utiliser sha1 pour calculer la somme de contrôle, car la production de collisions n'est pas si simple lors de l'utilisation d' algorithmes sha1 . La production de la somme de contrôle sha1 est assez facile comme vous pouvez le voir ici .
la source
sha1
n'est pas pertinente pour cette tâche; cela n'a d'importance que pour la sécurité .