Supprimer les fichiers MP3 en double avec un nom, une taille et un hachage différents

9

J'ai une énorme bibliothèque de musique (tout mp3), mais une partie de la musique est presque la même mais:

  1. Peut-être une ou deux secondes de plus
  2. 97% identique à une autre chanson
  3. Ou un autre bitrate.

Existe-t-il un moyen de trouver ces doublons? Comme mentionné, ils n'ont pas la même taille, le même nom ou le même hachage SHA1.

Hans Groeffen
la source

Réponses:

3

Il y a un système open source d'empreintes digitales acoustiques appelé Echoprint , vous voudrez peut-être vérifier que je veux dédupliquer une grande collection . Je ne l'ai pas utilisé auparavant (je suis juste tombé dessus), mais cela semble génial de pouvoir le faire localement.

Adrian Frühwirth
la source
Indépendamment de cela, si vos fichiers sont correctement balisés (je ne suis pas sûr que par leur nom, vous vouliez dire les noms de fichiers et / ou les balises ID3), il existe également des outils de déduplication qui fonctionnent sur la base des balises.
Adrian Frühwirth
6

Utilisez le Picard de MusicBrainz . Il scanne la musique pour générer une «empreinte digitale», puis la compare à une base de données en ligne pour l'identifier (en tirant toutes les informations comme l'artiste, l'album, etc.).

Après avoir identifié les chansons, il peut les organiser dans un répertoire personnalisé et une structure de nom, et vous pouvez l'utiliser pour trouver les doublons.

Entièrement compatible avec Linux.

Patrick
la source
C'est la voie à suivre, fonctionne très bien.
slm
D'accord, je pense que j'ai un problème. Aucune de mes musiques n'est commerciale. La majeure partie est sous licence CC téléchargée depuis Jamendo. Il dit qu'il ne trouve aucune correspondance.
Hans Groeffen
@HansGroeffen alors ce serait un problème. Vous êtes autorisé à publier des empreintes digitales de musique inconnue, vous pouvez donc le faire, mais vous devez faire un effort pour valider l'exactitude de la soumission. Étant donné que vos noms ne correspondent pas, ce n'est peut-être pas une bonne idée. Je ne sais pas s'il existe un moyen de simplement l'utiliser pour ses capacités d'empreinte digitale et de comparaison.
Patrick
2
La base de données MusicBrainz que Picard utilise est modifiable par l'utilisateur. Vous pouvez créer de nouvelles entrées pour les artistes, les œuvres (chansons) et les sorties (albums / EP), puis utiliser Picard pour réétiqueter / déplacer les fichiers. C'est un peu d'effort, mais cela fonctionne - et c'est utile pour les autres.
naught101
3

Je recommanderais d'utiliser beetsavec son duplicatesplugin; beetsest similaire picarden termes de fonctionnalités (il peut rechercher des informations ID3 dans la base de données musicbrainz et organiser vos fichiers en fonction de ces informations), mais va au-delà des capacités de picard avec certains de ses plugins.

Personnellement, je les utilise ensemble - picard pour nettoyer les balises ID3 et les betteraves pour organiser les fichiers et nettoyer les doublons.

STW
la source