J'ai un tas de messages en double dans Maildir de mon serveur IMAP. Quelle est la meilleure façon de les supprimer?
Quelques points pertinents:
- L'ID de message partagé est généralement une définition suffisamment bonne du doublon. Un petit script qui supprime tous les messages en double sauf un fonctionnerait.
- Parfois, il est nécessaire de rechercher des doublons en fonction des corps de message partagés. Quelle est une définition raisonnable de partagé ici? Équivalent au niveau du bit? Qu'en est-il des différences étranges dans le retour à la ligne, l'échappement et l'encodage des caractères?
- Parfois, il existe une différence significative entre les messages «en double». Quelle est la meilleure façon d'examiner les différences dans les ensembles de messages «en double»? Diffs?
pour les fichiers génériques sous linux, j'utilise des utilitaires fdupes pour supprimer les fichiers en double. J'ai trouvé que cela fonctionne également pour les messages Maildir.
la source
.forward
ou quoi que ce soit aura des en-têtes légèrement différents, donc bien que le message lui-même soit un doublon, les deux fichiers contenant les deux copies peuvent ne pas l'être.L'évolution de Gnome [un agent utilisateur de messagerie graphique] a une fonction intégrée pour supprimer les doublons. Comme expliqué sur cette page d'aide , cela se résume à:
Voilà.
PS Evolution peut accéder à vos messages localement (MailDir, MH, Mbox) ou via IMAP.
la source
Le mieux que j'ai trouvé aujourd'hui est la déduplication maildir de Kevin Deldycke .
X-MIMETrack
tête par défaut et compare les en-têtes à l'aide duSHA224
résumé.Je parie que quelqu'un pourrait faire quelque chose de fantaisie à partir de delIMAPdups.pl de Rick Sanders , une partie de ses outils IMAP .
la source
maildir-deduplicate
déplacé vers un nouvel emplacement , j'ai donc mis à jour le lien. Cependant, vos informations sont désormais obsolètes.