Dans le fichier robots.txt, puis-je écrire l'URL relative suivante pour le fichier de plan de site?
sitemap: /sitemap.ashx
Ou dois-je utiliser l'URL complète (absolue) du fichier du plan du site, comme:
sitemap: http://subdomain.domain.com/sitemap.ashx
Pourquoi je me demande:
- Je possède un nouveau service de blog, www.domain.com, qui permet aux utilisateurs de bloguer sur accountname.domain.com.
- J'utilise des caractères génériques, donc tous les sous-domaines (comptes) pointent vers: "blog.domain.com".
Dans blog.domain.com, j'ai mis le fichier robots.txt pour permettre aux moteurs de recherche de trouver le plan du site. Mais, en raison des caractères génériques, tous les comptes d'utilisateurs partagent le même fichier robots.txt.C'est pourquoi je ne peux pas utiliser la deuxième alternative. Et pour l'instant, je ne peux pas utiliser la réécriture d'url pour les fichiers txt. (Je suppose que les versions ultérieures d'IIS peuvent gérer cela?)
la source
robots.txt
sans la majuscule R.http
ethttps
, vous ne devez fournir qu'un seul plan du site (avec la variante canonique) .Les robots d'exploration de Google ne sont pas assez intelligents, ils ne peuvent pas explorer les URL relatives, c'est pourquoi il est toujours recommandé d'utiliser des URL absolues pour une meilleure capacité d'exploration et une meilleure indexabilité.
Par conséquent, vous ne pouvez pas utiliser cette variante
La syntaxe recommandée est
Remarque:
la source
Bonne question technique et logique mon cher ami. Non dans le fichier robots.txt, vous ne pouvez pas utiliser l'URL relative du plan du site; vous devez aller avec l'URL complète du plan du site.
Il est préférable d'utiliser "sitemap: https://www.example.com/sitemap_index.xml "
Dans l'URL ci-dessus, après le signe deux-points donne de l'espace. J'aime aussi soutenir Deepak.
la source