Google envoie-t-il des formulaires HTML?

10

J'ai une page Web, disons http://domain/purchaseet dans cette page, j'ai un formulaire Web. L'utilisateur, lors de la soumission de ce formulaire (qui a une validation, côté client et côté serveur et ne sera pas validé tant que les champs ne sont pas remplis de manière appropriée), serait redirigé vers une autre page, où il pourra choisir d'autres choses et spécifier d'autres paramètres, puis achetez notre produit. Disons que la deuxième page est http://domain/options.

Ainsi, l'utilisateur vient sur notre site et visite http://domain/purchase, remplit le formulaire, le soumet, puis serait redirigé vers la deuxième page http://doamin/options?parameter1=value1&parameter2=value2, qui contient les paramètres de la première page. Ceci est très courant lors du passage de paramètres entre des pages Web (ou techniquement, entre des URL).

Maintenant, je passais en revue mon site Web et j'ai vu que Google avait indexé certaines de mes pages Web et URL redirigées, comme:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

Cela signifie que Google Bot a visité notre http://domain/purchasepage, a rempli notre formulaire, l'a envoyé et a été redirigé vers l'autre URL, avec les paramètres correspondants. C'est la seule façon qui me semble logique. Google remplit-il vraiment les formulaires?

PS: Tous les paramètres sont significatifs, ce qui signifie qu'ils ne sont pas remplis arbitrairement. Par exemple, le paramètre de téléphone dans les pages indexées a des numéros de téléphone corrects. Comment est-ce possible?

Saeed Neamati
la source

Réponses:

8

Google est en mesure d'explorer des formulaires HTML depuis 2008 .

Après avoir choisi les valeurs pour chaque entrée, nous générons et essayons ensuite d'explorer des URL qui correspondent à une éventuelle requête qu'un utilisateur peut avoir faite. Si nous vérifions que la page Web résultant de notre requête est valide, intéressante et inclut du contenu qui n'est pas dans notre index, nous pouvons l'inclure dans notre index comme nous le ferions pour toute autre page Web.

D'un autre côté, comme il est peu probable que GoogleBot connaisse les paramètres corrects à mettre dans ces champs, il peut y avoir une autre explication. Est-il possible que vos utilisateurs établissent un lien vers les pages redirigées?

Kat
la source
Cette vidéo Google Webmaster couvre également les deux points: youtube.com/watch?v=xS0oHYZafTQ
DisgruntledGoat
Il indique qu'ils explorent uniquement les formulaires GET . Ma méthode de formulaire est POST . Par conséquent, non applicable. Ouais, pourquoi pas, les URL sont toujours capables de créer des liens.
Saeed Neamati
5
Si vous voyez ?parameter1=value9&parameter2=value10dans les URL, ils les obtiennent; POST n'intègre pas les variables de formulaire dans l'URL.
Wooble
@Woobie: Dans ce cas, les paramètres d'URL semblent résulter d'une redirection côté serveur, après que le formulaire a été POST.
MrWhite
4

Google devient plus agressif lorsqu'il s'agit de soumettre des formulaires.

John Conde
la source
La ligne clé est: "Nous avons commencé des expériences pour réécrire les requêtes POST à ​​GET";)
Zhaph - Ben Duguid