Comment trouver des photos en double?

Réponses:

60

digiKam Installer via le centre de logiciel

Ajoutez toutes les photos à votre collection. Dans le menu, sélectionnez «Outils / Rechercher les doublons». Cela recherchera les doublons dans toute votre collection.

findimagedupes Installer via le centre de logiciel

Un outil de ligne de commande. Passez toutes les images que vous souhaitez comparer sur la ligne de commande.

Geeqie (anciennement GQview )Installer via le centre de logiciel

Dans le menu, sélectionnez «Fichier / Rechercher une copie». Faites glisser et déposez les fichiers d’image pour dupliquer la fenêtre. Vous pouvez supprimer des répertoires pour ajouter leur contenu de manière récursive. Pour la comparaison visuelle des images, un menu déroulant contient des options spécifiques, autres que les options par défaut. Le niveau de similarité "personnalisé" permet de restreindre les associations uniquement au degré de similitude le plus élevé, mais il doit être défini sur "Préférences" sur 99. Même dans ce cas, cela ne fonctionne pas parfaitement, du moins pour certains types d’images, comme les art. Malheureusement, il ne fournit pas de mécanisme de sélection automatique avec des critères rationnels, tels que la résolution, la date ou autre, la sélection automatique semble ne prendre que la première image trouvée comme référence à préserver. La suppression de nombreuses images peut être extrêmement lente, car elle tente de mettre à jour le nombre de résultats à chaque suppression.


Ces trois outils trouvent des doublons visuels, pas seulement des fichiers octets identiques.

Gilles, arrête de faire le mal
la source
7
J'ai trouvé que Geeqie fonctionne le mieux. Il dispose d'un ensemble robuste de modes de recherche (nom, somme de contrôle, taille, etc.), d'une numérisation puissante d'images par similarité, d'informations détaillées sur les doublons trouvés, d'une interface utilisateur simple et il n'est pas nécessaire d'ajouter des images à une collection ou à un album. Mon seul inconvénient est que la recherche de doublons est masquée dans le menu Fichier et que vous devez effectuer un glisser-déposer depuis Nautilus (ou autre FM) pour pouvoir ajouter des images / dossiers à rechercher. Autre que cela, le travail est fait et le fait bien.
japzone
2
Geeqie peut trouver des images similaires et cela fonctionne plutôt bien, mais je l’ai trouvé un peu lent pour les correspondances exactes et il est fastidieux d’enlever de nombreux doublons avec.
Wernight
Un autre choix (qui semble fonctionner plutôt bien) est cet outil, également appelé findimagedupes , mais n'a aucun lien avec l'outil hébergé sur Sourceforge.
Winny
Digikam possède une interface de recherche de doublons étonnante. Je recommande fortement.
Wbkang
22

FSlint Installer FSlint

fslintest un programme graphique capable de trouver des fichiers en double de tout type avec md5sum. Si les images ne sont pas identiques, elles ne seront pas marquées comme des doublons. L'image ci-dessous montre plusieurs fichiers pdf en double dans le répertoire Téléchargements:

entrez la description de l'image ici

Vous pouvez modifier les paramètres de recherche avancée pour rechercher par type de fichier et vous limiter aux images. Cela se fait en modifiant les "paramètres de recherche supplémentaires" en tant findqu'options de commande. Par exemple, ici, je ne cherche que des *.jpgfichiers (dans le même chemin, uniquement dans mon dossier "Téléchargements":

entrez la description de l'image ici

fdupes Installer fdupes

fdupesest un outil équivalent basé sur la ligne de commande. Les deux sont disponibles dans les pensions.

John Lyon
la source
12
Notez que je doute que ces programmes trouvent des doublons redimensionnés.
Vadim Peretokin
@Vadi, c'est une question différente et plus compliquée. Tineye identifie les images sans recourir à des métadonnées, des hachages, etc. (il peut identifier des images similaires), mais il s’agit d’un service en ligne. Ils fournissent une API, mais je ne suis pas au courant d'applications qui en tirent parti. L'autre complication est que vous ne voudriez pas supprimer des images similaires tout le temps, par exemple si vous modifiez des photos mais souhaitez conserver des copies des originaux. Supprimer les doublons identiques est beaucoup plus sûr.
John Lyon
4
L'OP indique explicitement "y compris les photos qui ont été redimensionnées", donc ce n'est pas une réponse.
Calimo
7

fdupes Installer fdupes

Vous pouvez utiliser un outil de ligne de commande appelé fdupespour rechercher les fichiers en double (voir man fdupespour plus de détails). Je ne connais aucun moyen de trouver des «doublons» qui ont été redimensionnés. Un programme faisant cela nécessiterait une sorte d'algorithme intelligent qui analyserait le contenu de l'image car, lorsqu'une image est redimensionnée, ses données sont modifiées, de sorte que les méthodes de recherche de doublons traditionnelles ne fonctionnent pas.

dv3500ea
la source
fdupes manquera également les doublons dans différents répertoires; Supposons que vous ayez deux copies d'une photo, une dans le dossier fête d'anniversaire / et l'autre dans family-stuff / ... "fdupes -fr". va manquer ce duplicata.
lrkwz
2
fdupes ne gère pas les doublons qui ont été redimensionnés ni les modifications de métadonnées.
Calimo
6

imgSeek Installez imgseek

imgSeek peut trouver des doublons ainsi que des images similaires (il devrait donc être capable de trouver des photos redimensionnées et des photos avec des noms de fichier et des métadonnées différents) et même de rechercher des photos sur la base d'un croquis. Il est disponible dans les versions de bureau et serveur.

Je n'ai pas vraiment essayé moi-même, cependant.

david.libremone
la source
disponible uniquement pour Ubuntu 10.04, bien qu'il existe une bibliothèque Perl pour 12.04
drevicko
La version du serveur isk-daemonfonctionne sur 12.04, bien que j’ai trouvé que j’avais à installer à partir du source ( pip installselon la page d’installation ne fonctionnant pas)
drevicko
4

DupeGuru Picture Edition fonctionne vraiment bien et vaut la peine d’être essayé.

Ils ont un PPA Launchpad , dupeguru(nouveau package tout-en-un) ou dupeguru-pe(ancien package édition d'image) peuvent être installés à partir de celui-ci à l'aide des commandes suivantes:

sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
tuxflo
la source
On dirait que dupeGuru n'a plus d'éditions séparées. Cela fonctionne bien, bien que l'interface utilisateur puisse être meilleure. Il est également disponible dans AUR si vous utilisez Arch.
user31389
2

Visipics

Visipics est une application Windows gratuite pour cette fonction, mais fonctionne parfaitement sous Linux, via wine, bien entendu (c'est mieux que geeqie / gqview en ce qui concerne le tri des doublons (les résultats de geeqie sont absolument "non triables").

Vous pouvez lui dire de sélectionner automatiquement les images en fonction de critères tels que la taille réduite du fichier, le type non compressé, la résolution inférieure (cela ne fera pas le contraire, vous devrez le faire manuellement, ce qui ne serait pas beaucoup mieux que de le faire sur geeqie, sauf que la sélection ne nécessite pas de maintien Shift/ Ctrl), et même de hiérarchiser les dossiers (mais la dernière priorité est la priorité du dossier).

Vous devez faire attention aux liens symboliques, cependant - il peut "aléatoirement" choisir de sauvegarder un lien symbolique vers un fichier tout en supprimant le fichier réel en tant que "copie". C'est une honte.

le dsc
la source