Comment lutter contre les spammeurs Google Analytics?

43

Les mois derniers, j'ai beaucoup de spammers référents dans mes statistiques de GA. Leur nombre est environ 10 fois supérieur au nombre de visiteurs légitimes (mon site n’est pas encore très populaire). J'ai activé une option pour masquer les spammeurs connus dans les paramètres de GA, mais cela n'a pas aidé du tout. Il semble que ces spammeurs utilisent des scripts pour envoyer du spam directement à GA (c’est-à-dire qu’ils ne sont pas enregistrés dans mes IIS).

Est-ce que je peux faire quelque chose pour arrêter ces spammeurs?

UPD 10 mois plus tard, ils ont commencé à envoyer des pourriels en utilisant de faux noms de pages cibles ... et Google ne fait toujours rien à ce sujet.

utilisateur626528
la source
1
S'il vous plaît, vérifiez que les fichiers de votre journal ne contiennent pas de résultats contenant du spam de renvoi et faites-nous savoir si vous en voyez. Si vous le pouvez, modifiez la question et incluez le spam référent en question. Je suppose que je connais déjà la réponse. Je suis en train de faire des recherches et il y a pas mal d’activités de référencement que j’ai moi-même expérimentées. De plus, si WordPress est installé, assurez-vous qu'il est à jour. L'un des sites semble également s'attaquer aux vulnérabilités de WP. En outre, ne visitez aucun de ces sites, sauf si vous utilisez un navigateur de texte tel que Curl.
closetnoc
@closetnoc, ces spammeurs ne sont pas connectés sur mon serveur. Comme je l'ai écrit, ils envoient des spams directement à GA. Je n'utilise pas WP. "inclure le spam référent en question" - que voulez-vous dire?
user626528
Je sais qui ils sont et j'ai posté une réponse.
ClosetNoc
Le moyen le plus simple et le plus simple d'éviter ce problème est d'utiliser: referrerspamblocker.com Il s'agit d'une configuration automatisée des filtres dans Google Analytics. L'utilise depuis des mois maintenant.
Rody van Sambeek
La définition de "bot filtering" sur true dans les paramètres de Google Analytics vous aide-t-elle à résoudre le problème? - lunametrics.com/blog/2014/08/07/…
sam.

Réponses:

7

Le spam devient incontrôlable. La liste est de plus en plus longue et prend beaucoup de temps et n'est même pas efficace pour ajouter un filtre pour chacun des spammeurs, car la plupart d'entre eux apparaissent pendant quelques jours, puis disparaissent et un nouveau vient.

Il y a beaucoup de désinformation, l’ erreur la plus courante est de recommander l’utilisation du .htaccess , ce fichier bloque l’accès au site Web, bien qu’il existe quelques robots (5 ou 6) pouvant être bloqués, la grande majorité des spams ne jamais accéder à votre site est Ghost Spam.

Le meilleur moyen d’arrêter ce type de spam (Ghosts) est de créer un filtre de nom d’hôte valide . Le spam fantôme utilise un nom d’hôte faux ou non défini. Ainsi, avec ce filtre, il n’est pas nécessaire d’ajouter d’innombrables filtres. Un seul filtre suffit. soin de l'ancien et du nouveau spam. . Utilise cette solution avec succès depuis 3 mois

Plus d'informations sur cette méthode ici:

https://stackoverflow.com/a/28354319/3197362

Carlos Escalera Alonso
la source
Je suis heureux que ce soit la réponse acceptée, cela devrait vraiment être plus apprécié. La grande majorité des redirecteurs de spam dans Analytics sont des référents fantômes. Il y en a qui vous devez bloquer .htaccess, mais c'est une bataille continue pour les empêcher de fausser les chiffres (Semalt étant le principal coupable de cela - légitime, ma tante Fanny).
GeoffAtkins
Oh Carlos, je suis sur le point de recommander le guide de lutte contre le spam sur votre site . Je sais que ce commentaire sera perçu comme un moyen de référencement / vente, mais ce n'est pas le cas. J'admire vraiment votre contribution à ce guide.
Ooker
35

D'accord. Sans connaître les sites en question, je vais essayer d'expliquer un peu ce qui se passe et de ne fournir que quelques liens.

De: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Je reçois les noms de domaine suivants associés à la nouvelle méthode de spam par parrain que les internautes voient récemment.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (ajouté le 16 janvier 2015)
  • Bestwebsitesawards.com (New- ajouté le 3 février 2015)
  • Ranksonic.info (Nouveau - ajouté le 3 février 2015)
  • Cenoval.ru (New- ajouté le 6 février 2015)
  • oo-6-oo.com (New- ajouté le 25 février 2015)
  • Humanorightswatch.org (ajouté le 4 mars 2015)
  • S.click.aliexpress.com (New- ajouté le 17 mars 2015 - Suspecté)
  • www1.social-buttons.com (New- ajouté le 23 mars 2015 - Suspecté)
  • 4webmasters.org (New- ajouté le 26 mars 2015 - Suspecté)
  • Googlsucks.com (Nouveau - ajouté le 07 avril 2015)
  • Addons.mozilla.org (New- ajouté le 07 avril 2015 - Suspecté)
  • Smallseotools.com (Nouveau - ajouté le 13 avril 2015 - Suspecté)
  • Theguardlan.com (Nouveau - ajouté le 14 avril 2015)
  • Buy-cheap-online.info (New- ajouté le 16 avril 2015 - Suspecté)
  • Site1.free-share-buttons.com (Nouveau - ajouté le 29 avril 2015 - Suspecté)
  • Sanjosestartups.com (ajouté le 25 mai 2015)
  • Trafficmonetize.org (New- ajouté le 03 juin 2015 - Suspecté)
  • Howtostopreferralspam.eu (New- ajouté le 09 juin 2015 - Suspecté)
  • Www10.free-social-buttons.com (New- ajouté le 16 juin 2015 - Suspecté)
  • Getitfree.fr (Nouveau - ajouté le 18 juin 2015 Impossible de déterminer la propriété. Merci - Trey Copeland)
  • Www6.free-social-buttons.com (New- ajouté 18 juin 2015 - Suspecté)
  • Erot.co (New- ajouté le 26 juin 2015 - Suspecté)
  • 3g2upl4pq6kufc4m.onion (New- ajouté le 04 juillet 2015 - Suspecté)
  • Traffic2money.com (New- ajouté le 28 juillet 2015 - Suspecté)

Remarque: les éléments suspectés semblent suivre le même modèle de propriété et ne peuvent pas être liés au même auteur.

Une liste assez exhaustive de référenceurs de spam maintenus par Piwik est disponible à l’ adresse suivante : https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Merci - user2428118)

Citer:

BlackHatWorth.com est un domaine relativement nouveau créé le 7 janvier 2015 et qui est maintenant utilisé pour le spam parrainé. En fait, ce site Web de spam de parrainage est caché derrière le nom d'un moteur de recherche de magasinage et de belles images de paysages.

... l'adresse IP de BlackHatWorth.com, qui est 78.110.60.230, est la même que celle associée à d'autres sites Web de spam parrainé ...

En fait, le domaine BlackHatWorth.com appartient au même Russe qui est propriétaire des autres domaines de spam de renvoi tels que ILoveVitaly.com, Econom.co et Darodar.com. Le nom du propriétaire du domaine est censé être Vitaly A Popov de Samara (ville), Samaraskaya Oblast (Etat), Russie.

Vous ne pouvez pas bloquer ça!

De: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Citer:

Voici un bref aperçu du fonctionnement de Google Analytics.

Donc, vous obtenez une configuration sur GA et vous obtenez un code. Le code ressemble à UA-numéro-1 ou quelque chose du genre. Ce numéro est votre "numéro de compte" sur GA. Maintenant, ce code et un peu de javascript vont sur votre page Web. Maintenant, quelqu'un visite votre page et son navigateur exécute ce code javascript.

Ce code javascript est ce que "enregistre" leur visite. Il fait parler leur navigateur à Google Analytics. Plus précisément, il crée certains types de requêtes HTTP pour lesquelles Google enregistre des informations, puis GA affiche des résumés de ces informations.

Assez basique, non? Encore avec moi? Bon, maintenant, si tout ce que c’est est ce Javascript qui leur envoie la «visite», alors tout le monde peut simuler cela. Tout le monde. Tout ce que je dois faire pour que votre GA montre de fausses informations est d’envoyer mes fausses informations directement à GA.

Je n'ai pas besoin de visiter votre site du tout. Je n'ai pas du tout besoin d'exécuter javascript. J'ai juste besoin de reproduire ces requêtes HTTP, qui sont publiques, afin que tout le monde puisse les voir et voir comment elles fonctionnent. Ils sont même assez bien documentés, publiquement, par Google eux-mêmes.

Alors, maintenant, disons que je suis un imbécile de spammeur. Je veux amener les gens à voir mon site spam. Alors qu'est-ce que je fais? J'écris un petit morceau de code pour envoyer des milliers de ces fausses demandes à GA, et je fais simplement défiler tous les numéros d'agent utilisateur, dans l'ordre, au hasard, peu importe. J'envoie une fausse visite, avec un faux référent, et mon nom de domaine spammy. Et devine quoi? Il apparaît dans vos écrans Google Analytics.

Vous voyez ce spam comme n'importe quelle autre visite normale. Car pour GA, ce fut une visite normale. Tout ce qu’ils enregistrent sont ces requêtes HTTP, qui proviennent normalement du code javascript de GA. Mais une demande est une demande, et en créer une fausse est très, très facile.

C'est ce qui se passe. Tout ce dont j'ai besoin, c'est votre numéro d'agent utilisateur et, avec un petit effort, je peux simuler une visite sur votre site sans même vous connecter réellement à votre site. Cette fausse visite peut contenir n’importe quel nom de domaine et n’importe quel référent que je choisis.

Il s’agit d’une attaque contre Google Analytics, destinée à promouvoir le contenu du site. Vous ne pouvez pas le bloquer sur votre serveur, car votre serveur n'est pas impliqué du tout.

Vous pouvez faire deux choses: premièrement, installez un filtre comme le suggère John Conde; et deuxièmement, voyez s’il existe un moyen d’informer Google. Pour cela je n'ai pas de réponse, mais j'ai une idée.

[Mise à jour]

Cela commence à prendre des proportions scandaleuses, allant de centaines de spams par jour à des publicités comme celle-ci:

entrez la description de l'image ici

placard
la source
2
@JohnMueller Ceci n'est pas dans votre royaume, mais pouvez-vous envoyer des courriels pour voir si G a des connaissances à ce sujet? Merci d'avance!!
closetnoc
2
@JohnConde Merci! John Mueller n'est peut-être pas au courant, mais quelqu'un en G. le devrait. Même s'il n'y a pas de réponse, au moins G devrait être prévenu s'il ne le fait pas déjà. C'est la bonne chose à faire pour nous tous. À votre santé!
Closetnoc
1
@JohnConde BTW- J'ai vu des questions à ce sujet sur d'autres sites de SE (et éventuellement liés). Je n'ai pas pris de notes, mais existe-t-il un bon moyen de diffuser une note aux autres mods? Ou devrais-je simplement rechercher ces noms de domaine dans Google, chercher des réponses et les publier?
closetnoc
1
@joelmdev Vous avez manqué le point que ceux-ci ne peuvent pas être bloqués. Ceci est une attaque directe sur Google. Personne n'a aucun contrôle sauf Google. Ils ont été notifiés et ceux-ci se sont arrêtés pour la plupart.
closetnoc
2
@Steve Je ne peux pas voir qu'il y a un gros gain, cependant, il doit y en avoir un quelque part. La personne mentionnée dans la réponse déteste Google et souhaite probablement le moins du monde embarrasser Google. Mais ils utilisent aussi clairement ce spam pour générer du trafic vers divers sites Web qui continuent à être enregistrés. J'ai même vu quelque chose comme une publicité utilisant cette méthode. C'est énervant comme l'enfer !! Cela fait plus de tort aux innocents que Google. Je suppose que cela fonctionne ... très triste.
closetnoc
5

Vous pouvez les exclure en créant un filtre . Vous devez trouver quelque chose d'assez spécifique pour ne pas bloquer accidentellement les bons visiteurs et c'est fastidieux, car vous devez ajouter manuellement chaque spammeur, mais cela fera l'affaire.

John Conde
la source
Avez-vous des conseils IIS qui peuvent aider? Je peux aider avec Apache, mais l'OP semble avoir IIS.
closetnoc
2
S'ils ne consultent pas leur site Web, ce que je crois avoir dit, ce ne serait pas une méthode efficace pour les bloquer. Ou ai-je mal lu la question?
John Conde
Je l'ai lu au fur et à mesure que le PO recevait des messages de spam de référence.
Closetnoc
2
En effet, mais apparemment, ils frappent directement GA au lieu de frapper leur site. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde
D'accord. Vous avez raison. Ma faute!! Je ne suis pas sûr de savoir pourquoi je ne l'ai pas compris parce que je lisais quelques informations à ce sujet juste avant cette question. Je reçois aussi des spams de parrainage et un article a mentionné (brièvement) qu’il n’y avait aucune entrée dans leurs fichiers de log. Nouvelle méthode intéressante.
closetnoc
4

Pour répondre directement à votre question de titre "Comment lutter contre les spammeurs référents", la réponse la plus simple consiste à supprimer Google Analytics et à passer à Piwik , qui bloque automatiquement tous les spams référents par défaut .

Je me rends compte que vous êtes probablement habitué à Google Analytics et que vous souhaitez continuer à l'utiliser, mais si vous regardez le tableau dans son ensemble, vous avez une autre option qui fonctionne très bien. Piwik peut également être configuré pour enregistrer les adresses IP des visiteurs si vous le souhaitez, et ne transmet pas les données des visiteurs à des agences de publicité tierces susceptibles de plaire à certains utilisateurs.

Tom Brossman
la source
2
À propos, la liste noire de spam de référence utilisée par
Matthieu Napoli
leur base de données de spam est assez petite. cela ne correspond même pas aux domaines mentionnés dans mon rapport d'analyse.
Don Dilanga le
1

Voici une règle qui fonctionne sur IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>
Flo
la source
2
Cette réponse n'a rien à voir avec la question d'OP, car les spammeurs envoient des spam directement à Google Analytics en contournant le serveur Web d'OP.
Alfred Myers
@ AlfredMyers Votre commentaire est en partie vrai, car certains spammeurs utilisent la méthode du serveur Web, d'autres utilisent la méthode directe comme vous le mentionnez. Dans ce dernier cas, la seule solution consiste à ajouter des filtres dans Google Analytics pour obtenir des rapports clairs. Pour éviter cela, je préférerais que Google utilise un identifiant unique haché plus long pour les comptes GA, afin que les spammeurs ne puissent pas simplement parcourir les numéros disponibles et les requêtes d'incendie.
Flo
L'OP indique spécifiquement "... ces spammeurs utilisent des scripts pour envoyer du spam directement à GA (c'est-à-dire qu'ils ne sont pas enregistrés dans mes IIS).". Donc, pour cette question spécifique, ils n’ont pas accès à son serveur Web.
Alfred Myers
1

Si vous êtes toujours à la recherche d'une solution et que vous ne comprenez pas les références faites, voici le guide définitif pour éliminer les spams de parrainage. Il s'agit maintenant de la 133e révision depuis le 28 décembre 2014: http://www.analyticsedge.com/2014 / 12 / removal-referral-spam-google-analytics /

TL; DR:

  • un filtre de nom d'hôte valide supprimera toutes les références fantômes (inclure le nom d'hôte mydomain.com)

  • un filtre d'exclusion spécifique (ou le blocage de sites Web) supprimera la liste beaucoup plus courte de robots d'exploration de spam (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for -website.com | button-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • un segment avancé peut être utilisé pour les supprimer de vos rapports historiques.

Le segment avancé peut être importé à partir de la galerie de solutions Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /

Mike Sullivan
la source
0

Au début de l'année dernière, j'avais pour tâche de trouver la meilleure solution possible au spam de Google Analytics. Comme tout le monde, j’ai essayé les approches recommandées mais rien ne semblait bien fonctionner. Alors, je me suis ensuite tourné vers Google Tag Manager, mais cela ne m'a pas beaucoup aidé non plus. Frustré et vexé, j'ai décidé de reconstruire le script de suivi de Google Analytics, en intégrant des mesures correctives contre les formes de spam les plus courantes et les plus gênantes.

Bien que n'étant pas parfait, après environ un an et demi de création, de test, de débogage et de refactoring, j'ai maintenant un script de suivi Google Analytics assez fiable, qui fonctionne parfaitement et qui est facilement personnalisable. Pour ceux qui veulent remplir des métriques, cela fonctionne comme un charme.

https://github.com/nickolasburr/intelligent-ga-tracking

noyer
la source