Google explore-t-il les sites Drupal en mode maintenance?

10

J'utilise Aegir pour cloner des copies de mon site sous un nom de sous-domaine, c'est-à-dire test.mydomain.com. Ces copies sont en mode maintenance pour éloigner les spammeurs et les regards indiscrets. J'utilise ensuite ces copies pour effectuer des tests et des travaux de développement avant de commettre des modifications sur mon site principal mydomain.com

Mais est-ce que je blesse mon référencement par l'existence de ces sites clonés? Google explore-t-il un site qui a été mis en mode maintenance? Cela me pénalisera-t-il d'avoir autant de sous-domaines sans issue?

Meggy
la source
3
Cette question semble être hors sujet car elle concerne les algorithmes internes de Google, pas quelque chose de spécifiquement lié à Drupal, ni quelque chose que nous pourrions jamais savoir avec un niveau de confiance significatif.
Mołot
7
@ Mołot Comment cela ne peut-il pas être sur le sujet? Le mode de maintenance est une fonctionnalité de Drupal. Il existe des méthodes pour gérer correctement ce scénario. Demander si Drupal fait la bonne chose est utile aux futurs lecteurs.
mpdonadio
2
@MPD au moins une partie "Cela me pénalisera-t-il d'avoir autant de sous-domaines sans issue" est totalement sans rapport avec Drupal. Les façons dont Google peut être dirigé vers une page en mode maintenance en premier lieu ne sont pas liées à Drupal.
Mołot

Réponses:

21

Lorsque vous mettez un site Drupal en mode maintenance, les non-administrateurs voient la page du mode de maintenance standard (en supposant que vous supprimiez les caches après cela). Si vous examinez la réponse, vous verrez qu'elle est renvoyée avec un code d'état HTTP de 503, qui de RFC 2616 est:

503 Service non disponible
Le serveur n'est actuellement pas en mesure de traiter la demande en raison d'une surcharge ou d'une maintenance temporaire du serveur. L'implication est qu'il s'agit d'une condition temporaire qui sera atténuée après un certain retard. Si elle est connue, la longueur du retard PEUT être indiquée dans un en-tête Retry-After. Si aucune nouvelle tentative n'est donnée, le client DEVRAIT traiter la réponse comme il le ferait pour une réponse 500.

Et sur le blog officiel de Google Webmaster :

Si mon site est en panne pour maintenance, comment puis-je dire à Googlebot de revenir plus tard plutôt que d'indexer la page "en panne pour maintenance"?
Vous devez configurer votre serveur pour renvoyer un état de 503 (réseau indisponible) au lieu de 200 (réussi). Cela permet à Googlebot de réessayer les pages plus tard.

Ainsi, cela prouve que Drupal fait la bonne chose, et que Google reverra votre site et indexera les pages la prochaine fois qu'il récupérera un code d'état non 5XX.

mpdonadio
la source
2
La page de connexion de l'utilisateur continuera de renvoyer un code d'état 200 OK (et affichera également des blocs et tels qui ne sont normalement pas visibles en mode maintenance ( # 722434 )); cependant, robots.txt a une directive Disallow: pour la page de connexion, donc les bots bien comportés ne l'indexeront toujours pas.
Garrett Albright
C'est un bon point concernant la page de maintenance elle-même, le code de réponse 503 signifie que Google n'indexera pas cette page de maintenance.
David Thomas
6

À moins que vous n'ayez fait quelque chose de personnalisé pour le permettre, Google ne peut pas explorer votre site en mode maintenance.

Parce que vous devez être connecté pour afficher, googlebot verra la page de maintenance désignée.

Pour obtenir des instructions supplémentaires de Google, consultez les liens suivants:

David Thomas
la source
Je pense que le fait était que vous ne voudriez pas que Google indexe la page de maintenance.
Fuzzy76
2

Vos inquiétudes:

Si vous ne savez pas si le mode de maintenance bloque "tout ce que vous voulez bloqué" à 100% (!) - mais en même temps, vous vous demandez si "quelqu'un comme google pourrait y accéder" " ... alors le mode de maintenance peut être un mauvais choix pour bloquer votre site de développement en premier lieu.

Recommandation:

Personnellement, je recommande simplement d'ajouter un .htpasswd à vos sites de développement.

Il est simple d'automatiser même à l'intérieur des déploiements d'aegir. Cela ne vous gêne jamais, car votre navigateur et tous les outils de ligne de commande peuvent les ignorer pour vous. Vous pouvez laisser entrer d'autres personnes. Il bloque le site à 100% sur Google, etc.

user18099
la source