Nous utilisons une grande liste d'expressions communes de polluposteurs dans le cadre de notre système de filtrage de spams. Toute correspondance dans l'objet ou le corps du message d'un courrier électronique le met directement en quarantaine hébergée dans Office 365.
Aujourd'hui, j'ai remarqué que notre premier faux positif avait été envoyé à la quarantaine hébergée. Je veux savoir quels mots ou quelles phrases correspondent à quelque chose dans la liste afin de pouvoir le supprimer de la liste mais de ne pas le trouver (en raison du grand nombre de mots-clés et de phrases que nous avons maintenant dans la liste).
Tout est actuellement dans un document du bloc-notes. J'ai pensé à utiliser Beyond Compare mais je ne vois pas comment cela pourrait fonctionner dans cette situation.
Comment mettre en évidence les correspondances entre le message d'origine et la liste de mots clés / expressions?
la source
Réponses:
Si chaque phrase clé se trouve sur une ligne distincte, le moyen le plus simple consiste à utiliser un fichier de traitement par lots:
Enregistrez-le sous
filter.bat
et exécutez à partir de la ligne de commande.keywords.txt
est le nom du fichier avec les mots-clés, par exempleet
message.txt
doit contenir le message en question:Une fois le script exécuté, les numéros de ligne correspondants sont générés dans
results.txt
:la source