Quelqu'un peut-il suggérer un bon utilitaire de détection de duplication de photos qui fonctionne bien lorsque je traite environ 100 Go de données (collectées au fil des ans)?
Je préférerais quelque chose qui fonctionne sur Ubuntu.
Merci d'avance!
Modifier: existe-t-il un outil qui m'aidera à réorganiser ma collection et à supprimer les doublons, une fois qu'ils auront été détectés?
Edit2: La partie difficile est de savoir quoi faire une fois que j'ai la sortie composée de milliers de fichiers en double (comme la sortie de fdupes).
Ce n'est pas évident si je peux toujours supprimer un répertoire en toute sécurité (c'est-à-dire si un répertoire peut contenir des fichiers uniques), quels répertoires sont des sous-ensembles d'autres répertoires et ainsi de suite. Un outil idéal pour ce problème devrait être en mesure de déterminer la duplication de fichiers et de fournir ensuite un moyen puissant de restructurer vos fichiers et dossiers. Faire une fusion par hardlinking (comme le fait fslint) libère en effet de l'espace disque mais cela ne résout pas le problème sous-jacent qui a provoqué la duplication au départ - c'est-à-dire une mauvaise organisation de fichiers / dir.
la source
Réponses:
ImageMagick à la rescousse. Je pense que la première étape de toute solution est de réduire la taille de votre collection. Si vous souhaitez comparer les photos par leur contenu , en particulier lorsque certaines sont des versions légèrement modifiées les unes des autres, un très bon début est de les réduire en vignettes, puis de comparer les vignettes. Cela est particulièrement utile lorsque vous souhaitez trouver des photos presque identiques et que vous souhaitez "ignorer" les différences sans importance lors de la comparaison.
Ma suggestion est, à un niveau élevé, que vous:
1- Utilisez l' outil mogrify d'ImageMagick pour réduire les photos en vignettes. Cela prendra un certain temps, mais cela rendra les étapes de comparaison réelles beaucoup plus rapides et plus précises.
2- Utilisez l' outil de comparaison d'ImageMagick qui vous permet de définir un seuil de comparaison, c'est-à-dire qu'il vous permet de trouver des photos à 85% similaires. Vous voudriez faire une expérience contrôlée pour trouver la valeur seuil que vous aimez le plus.
la source
Le visualiseur / organisateur de photos open source Geeqie dispose d'une puissante fonction de recherche de doublons . Il peut utiliser plusieurs stratégies différentes pour trouver des doublons:
Cela donne une liste de résultats qui peut inclure des miniatures afin que vous puissiez confirmer manuellement.
Cela sera probablement lent pour des milliers de fichiers, mais je pense que l'utiliser et le laisser fonctionner pendant quelques jours ou tout ce qui est probablement moins d'effort dans l'ensemble que de trouver ou de créer quelque chose sur mesure pour le cas - à moins que la correspondance de la somme de contrôle soit tout ce dont vous avez besoin.
la source
Il existe un petit utilitaire appelé "fdupes" qui peut faire ce que vous souhaitez?
Il existe également un autre utilitaire appelé "fslint" que vous voudrez peut-être essayer également. (Celui-ci a une interface graphique).
la source
fdupes
- il y a une option pour supprimer les dupes. askubuntu.com/a/476732dupeGuru Picture Edition est un outil de recherche d'images en double personnalisable pour Windows, Mac OS X et Linux.
Il y a quelques versions de dupeGuru (éditions standard, musique et image), et l'édition d'image vous permet de trouver des images visuellement similaires via un algorithme de comparaison de blocage de bitmap , entre autres méthodes (comme l'horodatage de l'image originale EXIF, ou les fichiers étant simplement identiques) .
Il a une variété d'autres fonctionnalités utiles comme les dossiers exclus, la prise en charge des bibliothèques iPhoto / Aperture et une personnalisation considérable de la façon dont il détecte les doublons et de ce qu'il en fait.
la source
Qu'entendez-vous par photos en double? Voulez-vous dire des fichiers identiques, disons simplement copiés une ou deux fois de plus? ou voulez-vous dire des photos qui «semblent» être les mêmes.
Si vous voulez dire des fichiers identiques, vous pouvez utiliser 'shasum' sur tous les fichiers, puis ordonner les résultats et trouver les lignes uniques avec 'uniq' et lancer un 'diff' pour voir ce qui a été éliminé. Tout est facile dans un shell Ubuntu.
la source
Il existe une application appelée "bleachbit", qui trouve les fichiers en double par taille, nom et autres filtres. Vous pouvez l'installer à partir du gestionnaire de paquets synapctic dans ubuntu.
la source