Sommaire
Si votre serveur élimine les pages avec des ligatures (comme le font les smartypants), les moteurs de recherche sont incohérents. Bing n'indexe actuellement pas correctement les ligatures. Je dirais qu'en général, cela demande des ennuis. Étant donné que les moteurs de recherche changent, il existe une méthode ci-dessous que vous pouvez utiliser pour tester la façon dont les moteurs de recherche vous intéressent aux ligatures d'index .
Si vos plats de serveur des pages avec du texte normal, puis Javascript les transforme en ligatures, qui est très bien . Les moteurs de recherche n'appliquent pas les modifications de contenu Javascript avant d'indexer les pages (bien qu'il soit allégué qu'il y a quelques exceptions comme le chargement des commentaires Facebook ). Puisqu'il existe une méthode standard pour donner du contenu dynamique aux moteurs de recherche et que cette méthode est approuvée par Google , ce serait une grande surprise si cela changeait à l'avenir. Google conseille de parcourir votre site à l'aide d'un navigateur en texte brut (par exemple, ils suggèrent Lynx ) pour voir votre contenu comme un moteur de recherche le voit.
Plus de détails sur le premier cas (pages recouvertes de ligatures dans le code) ...
En théorie
... cela ne devrait pas faire de différence pour un moteur de recherche bien configuré.
Tout d'abord, cela aide à comprendre la différence entre les glyphes et les caractères . Une ligature fi
est un glyphe qui représente deux caractères f
i
. La façon dont le logiciel le traite dépend de ce logiciel et dépend du contexte et de la tâche à accomplir - vous verrez dans les exemples de cette question liée que lorsque vous copiez et collez des glyphes, ce qui est collé varie: parfois le glyphe est collé, parfois le glyphe est traité comme ses caractères associés f
et i
est collé.
Tout processeur de texte automatique bien conçu qui s'intéresse à la sémantique du texte (moteurs de recherche, vérification orthographique, lecteurs d'écran ...) devrait traiter un glyphe comme identique aux caractères qu'il représente, et devrait être traité finally
comme identique finally
, car c'est le texte sens du fi
glyphe.
En pratique
Tout n'est pas bien fait ...
Voici un moyen simple de tester les moteurs de recherche. Voici une ligne de texte de cette autre question:
Copy the ligature fi from Illustrator to this input box
Si nous prenons la version non-ligatures de cette phrase et la recherchons entre guillemets:
(recherche sur "Copy the ligature fi from Illustrator to this input box"
):
- ... si un moteur de recherche traite les glyphes de ligature comme des correspondances pour les caractères qu'ils représentent, il trouvera cette page (et, lorsqu'elle sera indexée, celle-ci)
- ... si un moteur de recherche traite les glyphes de ligature comme différents des caractères qu'ils représentent, il ne trouvera rien jusqu'à ce que cette page soit indexée, puis, il ne trouvera que cette page, et les recherches avec la version de ligature trouveront cette page.
- ... si un moteur de recherche panique complètement à la vue de glyphes comme des ligatures, il ne trouvera rien, pas même cette page, et les recherches avec la version ligature ne trouveront rien non plus
Quelques résultats rapides pour les 5 meilleurs moteurs de recherche au monde (des liens vers les résultats de recherche):
- Google: Bon (type 1) . (malgré les commentaires ci-dessous, il s'adapte bien au formatage unicode ou HTML)
- Bing: échec ( type 2 ).
- Yahoo: échec ( type 2 ) (il s'avère que Yahoo est «propulsé par Bing»)
- Yandex (russe): Bon (type 1)
- Baidu (chinois): euh, aucune page graphicdesign.stackexchange.com ne semble du tout apparaître dans les recherches Baidu ... peut-être que nous y sommes interdits ...?!
f
i
équivalent sans aucun problème. Google semble bien se débrouiller - mais l'incohérence entre les différents moteurs de recherche est (dans mon livre au moins) un dealbreaker.Sur la base d'un exemple en direct que j'ai vu, je serais extrêmement préoccupé par une utilisation extensive de cela, car cela affectera le référencement. Les caractères spéciaux sont analysés en Unicode, l'algorithme de Google ne le lira donc pas. Cela devrait convenir à des utilisations parcimonieuses, mais je ne deviendrais pas fou avec ou n'utiliserais rien sur un élément important comme un titre.
Voici le lien vers l'exemple en direct que j'ai consulté: http://pages.cs.wisc.edu/~wolfson/ligatures.html
la source
l
i
f
i
etc. (voir comment cela les met en gras dans l'aperçu). Mais je ne voudrais certainement pas y compter ...