Je parcourais mon dossier de spam (ce que je fais rarement, car Gmail a rarement de faux positifs) et j'ai remarqué quelque chose d'intéressant:
Quelque chose comme plus de la moitié des messages ont au moins un emoji animé dans le sujet.
Aucun de mes amis n'utiliserait cette merde. Aucune entreprise valide avec laquelle je ferais des affaires ne le ferait jamais non plus.
Comment puis-je créer un filtre pour, peut-être, supprimer automatiquement les messages avec des emoji animés dans le sujet?
En utilisant l 'indice de jamesmstone ci - dessous, j'ai essayé une recherche avec subject:=?UTF-8?
et subject:"=?UTF-8?"
et plusieurs autres permutations, mais aucune n'a fonctionné.
Voici un exemple d'ensemble d'en-têtes de l'une de ces piles fumantes:
Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <[email protected]>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
for <[redacted]@gmail.com>;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
spf=pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) [email protected];
dkim=pass [email protected];
dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz;
[email protected]; q=dns/txt; s=default; t=1453691229;
bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version :
Content-Type : Content-Transfer-Encoding : To : From : Subject : Date :
Message-ID : From : Subject : Date;
b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <[email protected]>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <[email protected]>
goomoji
...Réponses:
Réponse courte
Au lieu d'utiliser des filtres Gmail qui dépendent de la fonction de recherche Gmail pour rechercher les emojis encodés dans les messages d'origine, créez un script à l'aide de la méthode GmailMessage :: getRawContent () de Google Apps Script pour traiter les messages.
Questions connexes
Vous trouverez ci-dessous des liens vers des réponses à des questions similaires sur ce site, y compris des scripts utilisant la méthode indiquée.
la source
J'ai créé un script Google Apps à ces fins.
C'est sur Github: https://github.com/spamzero/spamzero
Il vous permet de créer toutes sortes de règles avancées que vous pouvez comparer à votre dossier de messages indésirables, de sorte que les messages qui sont définitivement du spam seront nettoyés automatiquement.
la source
Ce n'est pas tout à fait ce que vous demandez (filtrer les emojis eux-mêmes plutôt que les messages avec des emojis) mais vous pouvez trouver une partie du contenu utile pour construire un meilleur filtre de message.
Il existe maintenant un script utilisateur open source Greasemonkey / Tampermonkey / Violentmonkey pour se débarrasser de ces cafards visuels irritants (juste les personnages, pas les messages eux-mêmes):
Objet Gmail Emoji Roach Motel
En regardant la source de ce script , vous verrez qu'il existe deux types généraux de cafards emoji que vous trouverez dans les e-mails de spécialistes du marketing abusifs (de nos jours, y compris eBay et Amazon, malheureusement):
Cafards basés sur des images HTML (y compris les horribles animés) aka goomoji
Cafards Unicode: Il existe encore de nombreux emoji (et autres séquences Unicode générant des images) que les spammeurs et autres spécialistes du marketing commencent à utiliser dans les lignes d'objet des e-mails et que gmail ne se convertit pas en images HTML. Dans certains navigateurs, ceux-ci apparaissent en gras et en couleur, ce qui est presque aussi mauvais que l'animation. Les navigateurs pourraient également choisir de les animer, mais je ne sais pas si oui. Ces séquences Unicode sont affichées par le navigateur sous forme de texte Unicode, donc l'apparence exacte (couleur ou non, animée ou non, ...) dépend du système de rendu de texte utilisé par le navigateur. L'apparence d'un emoji Unicode donné dépend également des sélecteurs de variation Unicode et des modificateurs d'emojiqui apparaissent à proximité dans la séquence de points de code Unicode. Contrairement au spam emoji basé sur une image, ces séquences peuvent être copiées et collées hors du navigateur et dans d'autres applications en tant que texte Unicode.
Pour ce dernier type, le script utilisateur inclut une expression régulière conçue pour capturer les séquences Unicode susceptibles d'être utilisées abusivement par les spécialistes du marketing. Le regex ressemble à ceci dans ES6 Javascript (le script utilisateur le traduit en regex pré-ES6 largement pris en charge en utilisant l'incroyable ES6 Regex Transpiler ):
la source