Supprimer les messages en double de Maildir

10

J'ai un tas de messages en double dans Maildir de mon serveur IMAP. Quelle est la meilleure façon de les supprimer?

Quelques points pertinents:

  • L'ID de message partagé est généralement une définition suffisamment bonne du doublon. Un petit script qui supprime tous les messages en double sauf un fonctionnerait.
  • Parfois, il est nécessaire de rechercher des doublons en fonction des corps de message partagés. Quelle est une définition raisonnable de partagé ici? Équivalent au niveau du bit? Qu'en est-il des différences étranges dans le retour à la ligne, l'échappement et l'encodage des caractères?
  • Parfois, il existe une différence significative entre les messages «en double». Quelle est la meilleure façon d'examiner les différences dans les ensembles de messages «en double»? Diffs?
Joseph Holsten
la source

Réponses:

3

pour les fichiers génériques sous linux, j'utilise des utilitaires fdupes pour supprimer les fichiers en double. J'ai trouvé que cela fonctionne également pour les messages Maildir.

Sarabande
la source
1
fdupes semble fonctionner uniquement pour les doublons exacts, tandis que l'OP demande (implicitement) des modèles de duplication plus complexes. Un message remis deux fois à cause de .forwardou quoi que ce soit aura des en-têtes légèrement différents, donc bien que le message lui-même soit un doublon, les deux fichiers contenant les deux copies peuvent ne pas l'être.
tripleee
0

L'évolution de Gnome [un agent utilisateur de messagerie graphique] a une fonction intégrée pour supprimer les doublons. Comme expliqué sur cette page d'aide , cela se résume à:

  1. Sélectionnez les messages suspects (ou tout simplement tous les messages)
  2. Allez dans le menu Messages , puis choisissez Supprimer les messages en double .

Voilà.

PS Evolution peut accéder à vos messages localement (MailDir, MH, Mbox) ou via IMAP.

Franklin Piat
la source
0

Le mieux que j'ai trouvé aujourd'hui est la déduplication maildir de Kevin Deldycke .

  • Il ignore l'en- X-MIMETracktête par défaut et compare les en-têtes à l'aide du SHA224résumé.
  • Il supprime automatiquement les doublons sans demander de confirmation; cependant, il existe un mode de marche à vide qui permet de prévisualiser les doublons qui seront supprimés.

Je parie que quelqu'un pourrait faire quelque chose de fantaisie à partir de delIMAPdups.pl de Rick Sanders , une partie de ses outils IMAP .

Joseph Holsten
la source
maildir-deduplicate déplacé vers un nouvel emplacement , j'ai donc mis à jour le lien. Cependant, vos informations sont désormais obsolètes.
Adam Spires
J'ai mis à jour ceci afin qu'il n'y ait plus d'informations obsolètes trompeuses.
Adam Spires