Pourquoi un site Web avec bourrage de mots clés se classerait-il plus haut qu'un sans dans les résultats de recherche Google?

C'est facile. La densité des mots-clés est un mythe. C'est du moins le cas maintenant.

Ce qui est important à noter, c'est comment les termes sont utilisés et non pas combien de fois ils sont utilisés. Les SEO aiment confondre intentionnellement le problème pour vous garder dépendant d'eux et payer pour des outils et des conseils. PT Barnum avait l'habitude de dire qu'il y avait un meunier né chaque minute . En référencement, le side-show semble être tous les conseils en ligne. Plus triste encore, les moteurs de recherche se déplacent plus lentement que le PageRank qui est beaucoup plus lent que l'herbe qui pousse au Sahara. Ils ne sortent pas facilement des anciens concepts même lorsqu'ils se sont trompés au départ.

Il s'agit d'un mini-didacticiel sur la façon dont les termes d'un site sont pondérés. Ce n'est pas une explication complète par n'importe quel tronçon, mais une illustration. C'est un voyage intéressant à faire pour mieux comprendre le fonctionnement du référencement.

Avant de peser les termes et les sujets du site à l'aide de la sémantique, la pondération des mots clés a été utilisée à l'aide de quelques indicateurs, notamment l'utilisation et le placement de termes dans des balises telles que les titlebalises, les balises d'en-tête,descriptionbalises méta, ainsi que la proximité les uns des autres et des balises importantes, et d'autres indications d'importance, etc. Une partie de l'indication de l'importance était l'utilisation de termes, de synonymes, de termes complémentaires et de l'importance de ces termes. Cela suit quelque peu la notion de densité des mots clés, et sachez que des ratios de termes ont été appliqués pour déterminer un sujet de page, cependant, ce ne sont pas les ratios de termes élevés ou faibles, mais un ratio qui supprimerait efficacement les termes courants, les termes répétitifs, les contre-sens utilisation de termes, et termes qui n'ont tout simplement aucune valeur par manque d'utilisation, etc. Ces ratios de termes ont été automatiquement évalués page par page et les résultats ont été associés à des calculs qui déterminent si les résultats étaient dans un domaine opérationnel. Quand tout a été dit et fait, les termes ont déterminé le sujet et la portée du sujet en utilisant la sémantique décrite plus loin. Mais la densité n'a pas mis à nu le classement de recherche en soi ', mais plutôt le sujet et l'intention de recherche correspondante. L'effet secondaire correspond à des termes d'une certaine densité par hasard, car les mêmes termes correspondent à un profil déterminé par des liens sémantiques et ont été utilisés pour déterminer l'intention de recherche. Cela a suivi le modèle de l'analyseur qui existe en partie encore, mais n'est pas le modèle entier. Plus maintenant.

La sémantique est le modèle principal aujourd'hui, mais comme le Web suit un modèle de texte traditionnel, le modèle de l'analyseur ne peut pas être entièrement supprimé. La raison en est simple. Il s'applique toujours et a du sens et est très utile.

La sémantique peut être décrite comme un «appariement relationnel» même si pour certains modèles sémantiques plus complexes, vous parlez vraiment de «chaînes relationnelles». Ceci est connu sous le nom de liens sémantiques et la relation entre les liens sémantiques est connue sous le nom de web sémantique qui n'a rien à voir avec le web, sauf que l'un est pratique pour l'autre. Pour mon illustration, je le garderai en paires simples bien que la sémantique devienne plutôt compliquée plutôt rapide. Donc, pour mon illustration, je simplifierai beaucoup les choses.

L'appariement relationnel est la notion simple de triplets; le sujet, le prédicat et l'objet. Le prédicat peut être n'importe quoi tant qu'il est représentatif entre le sujet et l'objet.

Je vais dévier vers un modèle de PageRank précoce. Veuillez rester avec moi. Ça s'applique.

Lorsque Google a été conçu, la notion de page rank était une représentation assez simple des réseaux de confiance utilisant la sémantique. Un lien se fait d'une page à l'autre. Dans ce cas:

Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com

Subject: exampleb.com
Predicate: trusts
Object: examplec.com
Read as: exampleb.com trusts examplec.com therfore examplea.com trusts examplec.com

Bien que nous sachions que la clause "donc" ci-dessus n'est pas nécessairement vraie, c'était le premier modèle et il est toujours vrai, quoique pas absolument vrai. Nous savons que examplea.com peut ne pas avoir connaissance d'examplec.com et ne peut donc pas entièrement faire confiance à examplec.com. Pourtant, il existe une relation qui doit être prise en compte.

L'utilisation précoce du terme PageRank a été calculée page par page - lien par lien mais appliquée à l'ensemble du site. Pour exampleb.com, combien de liens d'approbation existent? PageRank était un calcul assez simple des liens vers les pages d'un site. Mais cela posait des problèmes évidents. Des liens peuvent être créés pour gonfler artificiellement l'importance d'un site. Le calcul contenait un taux de désintégration assez standard qui pourrait corriger cela, cependant, le taux de désintégration en soi posait de nouveaux problèmes en ce sens qu'aucun taux de désintégration unique ne peut pleinement tenir compte de la valeur réelle car sa tendance naturelle est d'avoir une courbe dans son calcul.

En utilisant davantage le modèle de confiance, les domaines ont été pondérés en fonction de facteurs qui indiquaient la confiance. Par exemple, la mesure de confiance la plus importante est l'âge du site. Les sites plus anciens sont généralement fiables. Les sites avec un enregistrement cohérent, une adresse IP cohérente, un registraire de qualité, un réseau de qualité (hôte), n'ont pas d'antécédents de spam, de pornographie, de phishing, etc. indiquent tous la confiance. Je compte plus de 50 facteurs d'approbation de domaine, je vais donc les ignorer et continuer à rester simple.

Subject: examplea.com
Predicate: domain trust score
Object: 67

Subject: exampleb.com
Predicate: domain trust score
Object: 54

Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com

En utilisant un autre calcul, un certain niveau de confiance peut être établi et pas seulement un site binaire en fait confiance à un autre . Lorsque le premier exemple a réussi l'approbation, le deuxième exemple transmet une valeur d'approbation proportionnelle à la façon dont elle est calculée.

Maintenant, veuillez comprendre que le PageRank est calculé page par page et TrustRank est une partie majoritaire de SiteRank dont les liens, la qualité des liens, la valeur des liens jouent tous un rôle bien que beaucoup moins important qu'au départ et bien moins que le score de confiance du site . Garde ça en tête.

Comment cela s'applique-t-il aux mots clés sur une page?

Tous les termes de contenu sont pondérés, cependant, seuls certains termes de balises sont pondérés. Un exemple principal est le keywordsméta-tag. Nous savons tous que les termes de cette balise n'ont aucun poids. En fait, il est complètement ignoré. Une idée fausse est que le descriptionméta-tag ne compte pas pour le référencement. Ce n'est pas vrai. Pour les termes de cette balise, il y a du poids, cependant, il est relativement faible. La balise meta description a une valeur. Vous comprendrez pourquoi dans un instant.

L'ancien modèle d'analyseur a toujours de la valeur. En cela, la page est lue de haut en bas et les balises et les blocs de contenu sont lus et pondérés à l'aide de valeurs qui mesurent l'importance selon un modèle de haut en bas. Certaines métriques sont statiques. Par exemple, la titlebalise aura un score d'importance plus élevé que la h1balise qui sera plus élevée que n'importe quelle h2balise, etc. La descriptionméta-balise aura une métrique d'importance qui est assez élevée. Pourquoi? Parce que c'est toujours un indicateur important de l'objet de la page. Cependant, les termes trouvés dans l'étiquette ont peu de poids. Ceci est fait de sorte que les correspondances d'intention de recherche correspondent toujours descriptionaussi facilement à la méta-balise qu'une titlebalise et unh1mais ne peut pas être manipulé trop lourdement pour jouer au système. Veuillez noter que certaines conditions peuvent s'appliquer. Par exemple, une recherche ne correspondra pas à la descriptionméta-balise sans correspondre ailleurs principalement à la titlebalise ou à la h1balise ou dans le contenu.

En continuant avec le modèle de l'analyseur, imaginez un point au début du contenu réel. La proximité est une mesure utilisée de diverses manières. L'une est où un terme, une balise, un bloc de contenu, etc. est en relation avec ce point au début du contenu. Considérez maintenant les balises d'en-tête comme des indications de sous-sujets et imaginez un point au début du contenu suivant immédiatement une balise d'en-tête se terminant par la balise d'en-tête suivante. Là encore, la proximité est mesurée. La proximité est mesurée entre les termes d'un paragraphe, des ensembles de paragraphes,headerétiquettes, etc. Ces mesures sont calculées en fonction du poids des termes dans la façon dont ils sont utilisés et de leur importance apparente. Au-delà de cela, les termes, expressions, citations, et en fait toute portion similaire de contenu peuvent être mesurés entre les pages et les sites en utilisant un modèle de proximité légèrement différent mais toujours similaire.

Les pages sont liées en utilisant des liens d'une page à l'autre et la proximité de la page d'accueil ou de toute autre page où un nuage de relations peut être déterminé. Par exemple, une page de sujet sur le référencement peut avoir des liens vers plusieurs pages de sous-sujet SEO. Cela indiquerait que la page de sujet pour le référencement est importante dans la mesure où elle renvoie à plusieurs pages de sujet similaires et un nuage de relations peut être déterminé. Ainsi, pour toute page de sous-sujet SEO, la proximité serait un décompte des liens entre la page de sujet SEO et la page de sous-sujet SEO ainsi que le nombre de liens de la page d'accueil. En cela, une importance des pages peut être calculée. Quelle est l'importance de la page de sujet SEO? C'est un lien parmi les liens de navigation sur la page d'accueil et en effet chaque page - très important. cependant, les pages de sous-sujet SEO n'ont pas de liens de navigation et obtiennent donc toute importance de la métrique de la page de sujet SEO. Cela suit le modèle du réseau de confiance PageRank Semantic Link.

Pour en revenir au modèle PageRank d'origine, vous pouvez évaluer les pages dans la façon dont vous les liez, tout comme les liens transmettent de la valeur sur le World Wide Web. C'est ce qu'on appelle la sculpture, bien que la sculpture manipulatrice excessive puisse être déterminée et ignorée, alors soyez naturel. En faisant cela, vous indiquez également l'importance des termes trouvés sur ces pages. Ainsi, tout terme sur n'importe quelle page est non seulement pondéré dans l'endroit et la façon dont ils sont utilisés sur cette page, mais également l'importance apparente de la page dans la façon et l'endroit où elle existe sur votre site. Cela commence-t-il à avoir un sens?

D'accord. C'est bien, mais comment les termes sont-ils liés et comment la sémantique y contribue-t-elle? Encore une fois, en gardant les choses très simples.

J'ai un site sur les voitures. Vous êtes au Royaume-Uni et avez un site sur les automobiles. Il est assez évident que les voitures et les automobiles sont le même mot. Les moteurs de recherche utilisent un dictionnaire pour mieux comprendre les relations entre les mots et les sujets. Google s'est différencié en créant très tôt un dictionnaire d'auto-apprentissage. Je n'entrerai pas dans les détails, mais vous aurez toujours l'image. Utilisation de la sémantique:

Subject: cars
Predicate: equals
Object: automobiles

En cela, Google peut comprendre que mon site et votre site sont à peu près la même chose. Pour aller plus loin.

Subject: car
Predicate: is painted
Object: dark red

Subject: automobile
Predicate: is painted
Object: maroon

Subject: deep red
Predicate: equals
Object: maroon

En supposant un instant que seuls ces deux sites existent, toute recherche d' automobile rouge foncé pourrait entraîner l' automobile marron et la voiture rouge profonde même si l'automobile rouge profond n'existe pas sur le Web.

Au début du référencement, il était recommandé d'utiliser des synonymes et des versions plurielles des termes. C'était à l'époque où la sémantique n'était pas utilisée ou aussi forte. Aujourd'hui, vous pouvez voir que ce n'est pas nécessaire car les relations entre les mots et l'utilisation sont conservées dans une base de données sémantique.

En utilisant le même modèle mais en progressant un peu, si j'écris un article brillant qui est cité sur plusieurs autres pages Web, la sémantique peut le noter comme une citation et attribuer cela à mon travail original en lui donnant beaucoup plus d'importance même sans liens vers mon page du tout. En cela, une page sans liens entrants (arrière) peut surclasser une page avec un nombre élevé de liens entrants (arrière) simplement en raison d'une citation. Les citations sont une partie importante de l'application du Web sémantique au Web. En fait, alors que les SEO poursuivaient l'allusive AuthorRank, il n'y avait rien de tel. C'était toute la sémantique et l'appariement des paires de données dans lesquelles je n'entrerai pas, mais pour dire que, par exemple, écrit par pourrait indiquer le nom de l'auteur immédiatement après et donc un crédit de citation peut être appliqué à l'auteur si la pièce a été citée.

Pourquoi ai-je vécu tout cela ??

Pour que vous puissiez facilement voir que le mécanisme qui sous-tend l'évaluation de tout terme sur un site est beaucoup plus compliqué et ne dépend plus de la densité, ce qui n'a jamais été complètement le cas de toute façon. En fait, la densité n'est plus du tout un effet secondaire. La raison de cette simple. Il était facile à jouer et aucun taux de décroissance ne pouvait compenser le jeu comme dans le schéma original du PageRank.

Comme pour tout site bourré de mots clés, ce n'est qu'une question de temps avant que la sémantique ne les dévoile. Panda a commencé comme une tâche périodique conçue spécifiquement pour mesurer cela et d'autres choses similaires et ajuster les paramètres pour déclasser les effets d'un site incriminé dans les SERP. Bien que le SiteRank reste généralement le même, tout site détecté comme spam subira une baisse du score TrustRank ayant subi une violation, ce qui réduira légèrement le SiteRank. Je crois qu'il y a un élément de gravité dans ce mécanisme qui permet de corriger les infractions mineures sans préjudice. Ce coup persiste même lorsque le problème est résolu. En effet, la violation est conservée dans l'historique des sites. Donc, ce qui se passe, c'est que le placement SERP diminuera jusqu'à ce que le problème soit résolu, dans lequel le placement SERP recommencera à augmenter, mais jamais au niveau que le site incriminé avait une fois en raison de la notation de la violation. Plus une infraction vieillit, plus elle est pardonnée, ce qui permet à une infraction précédente de perdre son effet négatif au fil du temps. À noter, bien qu'il soit dit que Panda et d'autres s'exécutent plus souvent et que mon processus soit continu aujourd'hui, il faut encore du temps pour construire la carte de liens sémantiques pour savoir si un site est un délinquant. Cela signifie qu'un site s'en sortira avec du rembourrage pendant une période, mais échouera finalement une fois que les liens sémantiques et les métriques seront entièrement établis. De plus, je suis sûr qu'il y a un effet initial pour le rembourrage, mais il est considérablement diminué en utilisant le modèle sémantique et l'effet est plutôt superficiel en tant que sous-produit. En effet, lorsqu'une page est découverte, il n'y a pas grand-chose à faire avant que les mappages de liens sémantiques ne soient remplis. Google, dans sa sagesse, permet une certaine grâce permettant ainsi à la page de se classer haut pour les termes dans les signaux importants initialement avant de s'installer dans son bon placement dans les SERPs. En supposant que les signaux correspondent à la sémantique, recalculer le placement SERP entraînera un changement relatif dans la façon dont la page est trouvée. Sinon, si les signaux et la sémantique ne sont pas d'accord, le placement dans le SERP sera basé sur la sémantique et la façon dont la page est trouvée changera. C'est pourquoi il est important d'envoyer les bons signaux en premier lieu en utilisant des mots clés et des balises avec précision et honnêteté. permet une certaine grâce permettant ainsi à la page de se classer haut pour les termes dans les signaux importants initialement avant de s'installer dans son bon placement dans les SERPs. En supposant que les signaux correspondent à la sémantique, recalculer le placement SERP entraînera un changement relatif dans la façon dont la page est trouvée. Sinon, si les signaux et la sémantique ne sont pas d'accord, le placement dans le SERP sera basé sur la sémantique et la façon dont la page est trouvée changera. C'est pourquoi il est important d'envoyer les bons signaux en premier lieu en utilisant des mots clés et des balises avec précision et honnêteté. permet une certaine grâce permettant ainsi à la page de se classer haut pour les termes dans les signaux importants initialement avant de s'installer dans son bon placement dans les SERPs. En supposant que les signaux correspondent à la sémantique, recalculer le placement SERP entraînera un changement relatif dans la façon dont la page est trouvée. Sinon, si les signaux et la sémantique ne sont pas d'accord, le placement dans le SERP sera basé sur la sémantique et la façon dont la page est trouvée changera. C'est pourquoi il est important d'envoyer les bons signaux en premier lieu en utilisant des mots clés et des balises avec précision et honnêteté. puis recalculer le placement SERP entraînera un changement relatif dans la façon dont la page est trouvée. Sinon, si les signaux et la sémantique ne sont pas d'accord, le placement dans le SERP sera basé sur la sémantique et la façon dont la page est trouvée changera. C'est pourquoi il est important d'envoyer les bons signaux en premier lieu en utilisant des mots clés et des balises avec précision et honnêteté. puis recalculer le placement SERP entraînera un changement relatif dans la façon dont la page est trouvée. Sinon, si les signaux et la sémantique ne sont pas d'accord, le placement dans le SERP sera basé sur la sémantique et la façon dont la page est trouvée changera. C'est pourquoi il est important d'envoyer les bons signaux en premier lieu en utilisant des mots clés et des balises avec précision et honnêteté.

[Mise à jour]

J'ai coupé et collé cette réponse dans TextRazor https://www.textrazor.com/demo et voici un exemple. Vous verrez la position relative par rapport à ce point imaginaire au début du contenu et d'autres analyses linguistiques dans le tableau ainsi que les scores des sujets à droite. Vous pouvez faire de même en coupant le texte de cette réponse (au-dessus de cette mise à jour) et en le collant dans la page de démonstration et en jouant un peu. Je l'encourage. Cela vous donnera une bonne idée de la façon dont le contenu est traité.

Exemple TextRazor de cette réponse.

placard
la source

Très intéressant, merci. Je préfère la question juste pour votre réponse. Mais j'ai quelques doutes sur l'importance (même petite) de la balise de description et sur la possibilité de surclasser le contenu sans liens (au niveau théorique). Je ne suis pas un fan du référencement en général, je dois dire, pour son impossibilité d'expérimenter la réplicabilité. Il est impossible de gagner beaucoup de citations de manière naturelle sans obtenir de liens, ou de voir un certain niveau de corrélation entre les descriptions et les classements. Mais je me trompe peut-être.

lucgenti

@lucgenti Vous entendrez les référenceurs se référer aux liens comme des citations. Ce ne sont pas des citations, mais des liens. Il existe un chevauchement entre les liens et les citations, cependant, les mécanismes entre les deux sont très différents. Je sais qu'une petite citation influente sur un article scientifique publié sur le Web a conduit 10 000 utilisateurs sur mon site par jour aussi longtemps qu'il existait sur le Web. Les citations ont une influence puissante et peuvent vraiment apporter des pages et des sites beaucoup plus élevés dans les SERPs. De cette façon, une page sans liens arrière peut vraiment bien fonctionner en supposant tous les autres facteurs de référencement. Mais la citation doit être importante.

closetnoc

Oui, mais cette citation a non seulement conduit 10 000 utilisateurs vers votre site, mais aussi plusieurs autres signaux sociaux (liens, citation, etc.). Comment distinguer l'impact de variables individuelles?

lucgenti

@lucgenti Pensez-y de cette façon. Les liens sont linéaires et directs. Cela signifie que quelqu'un voit votre lien, clique dessus et visite votre site. Cependant, les citations sont des influenceurs et l'effet n'est pas direct. Cela peut augmenter l'importance d'un site ou d'une page et les placer plus haut dans les SERP en général, placer certaines pages plus haut dans les SERP par attribution (mentions directes), augmenter la valeur des liens, etc. Pour les citations, l'effet est un effet secondaire et non linéaire. Il n'est pas toujours possible de prédire l'effet d'une citation comme vous le pouvez avec un lien.

closetnoc

@lucgenti En ce qui concerne la description du titre, vous avez parfaitement raison! Lorsque le document a été publié, le trafic de recherche sur mon site avant et après était inférieur à 100 par jour, donc l'effet était plutôt évident. De plus, l'effet a été répété pour les sites Web de tous les auteurs. Maintenant, gardez à l'esprit qu'il s'agissait d'un document sur les nouveaux mécanismes de défense adaptative des réseaux et les nouvelles méthodes d'évaluation des réseaux de confiance, de sorte que les yeux du monde de la technologie étaient rapidement là. Il a été jugé important en fonction du trafic vers le journal. Encore une fois, aucun lien vers le journal, juste un trafic influent. Fou. Le social était un facteur.

closetnoc

Pourquoi un site Web avec bourrage de mots clés se classerait-il plus haut qu'un sans dans les résultats de recherche Google?

Réponses: