Je cherchais donc l'un de mes propres sites Web sur Google: http://www.botlibre.com
et à ma grande surprise trouvé quelques clones de mon site Web, comme:
http://83waystowasteyourtime.adidas.com
et:
http:// mediaiq.astral.comm
Ma question est:
- Pourquoi créent-ils des clones de mon site Web? Une sorte de schéma de référencement ou quoi? Quel gain pourraient-ils obtenir?
- Comment ont-ils une URL sur
adidas.com
etastral.comm
? Je suppose que ce n'est pas Adidas qui prépare mon contenu. - Comment puis-je fermer ces sites et empêcher les gens de voler mon contenu? (sur Tomcat)
google-index
legal
serps
James
la source
la source
Réponses:
D'accord. C'est plutôt étrange, mais pas aussi tragique que vous ne le pensez.
Je ne sais pas quel serait le gain. Cela n'a absolument aucun sens pour moi de savoir pourquoi quelqu'un ferait cela. Je ne vois aucun avantage pour le pirate informatique. La bonne nouvelle est que le visiteur accède à votre site. Cependant, il y aura un succès d'un point de vue SEO, donc vous voulez résoudre ce problème rapidement.
Votre site, je suppose, n'est pas sur un serveur partagé, donc si vous accédez à votre site par l'adresse IP, cela fonctionnera toujours. J'ai testé cela et ça le fait.
83waystowasteyourtime.adidas.com et mediaiq.astral.com sont des sous-domaines utilisant un ancien hack qui permet à quiconque de créer un sous-domaine pour tout domaine sans méfiance. Vous pouvez lire à ce sujet ici: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/ Il y a plus de sites si vous piratez le DNS du sous-domaine Google .
Voici la bonne nouvelle. Ce ne sont pas des clones ou des copies de votre site, ils sont votre site. Chaque sous-domaine pointe spécifiquement vers votre adresse IP.
Vous pouvez faire:
et
sur n'importe quel ordinateur Linux pour voir.
Vous pouvez probablement lutter contre cela, mais je ne sais pas quelle méthode fonctionnera:
En supposant que vous avez installé Apache, vous pouvez modifier votre fichier .htaccess dans votre répertoire racine Web et insérer le code suivant.
Ajoutez ce qui suit en haut du fichier pour activer le moteur de réécriture.
Blocage par l'hôte:
--ou--
Blocage par référent:
Vous voudrez les tester et nous dire lequel fonctionne. S'il vous plaît. Il se peut que nous devions chercher une autre méthode.
Bien sûr, vous pouvez modifier la règle de réécriture et les rediriger directement vers votre site, avec:
--ou--
Envoyez-les en enfer (humour) avec:
... qui est un vrai site. Mais vous leur transmettriez le problème.
Je recommande de les bloquer.
Comme @Martijn l'a mentionné dans son commentaire et cela vaut la peine d'être préservé, vous pouvez avoir des liens canoniques par page pour vous protéger. Dans ce cas, le lien pointerait vers la page sur laquelle se trouve le lien. C'est plus de travail, mais cela semble être une bonne idée de nos jours.
De plus, vous pouvez contacter les propriétaires du domaine parent et les laisser vous rejoindre dans la bataille:
Adidas.com
Astral.com
la source