Edit: Résumé
Apparemment, le caractère à afficher dans ce cas est un "tiret".
Cette page contient un tableau à mi-chemin qui indique que, pour –
certains, un logiciel convertira le code hexadécimal correct de 2013 en 0096. (regardez la première ligne du tableau).
Cette réponse sur Stackoverflow explique qu'il s'agit en quelque sorte d'un mélange entre Windows-1252 et UTF-8.
Cet article de blog impose ceci:
Le caractère 150 (0x96) est le caractère unicode "START OF GUARDED AREA" dans la plage de caractères de contrôle C1 non affichée, mais dans l'encodage Windows-1252, il est mappé sur le caractère affichable 0x2013 "en-tiret" (un tiret court). .
D'autres ont eu du mal à produire ce contenu, car cette réponse sur Stackoverflow montre comment remplacer 0x0096 par 0x2013.
Google doit en être conscient, car, comme indiqué dans la question initiale ci-dessous, la version mise en cache de la page Amazon par Google –
semble donc corriger automatiquement ces erreurs sur les pages mises en cache.
J'ai essayé de régler mon encodage sur Windows-1252, mais cela n'aide pas.
Alors maintenant, je suppose que ma question est la suivante: comment puis-je dire à Firefox d’ignorer des caractères non imprimables comme ceux-ci?
Contenu original ci-dessous:
(Firefox 3.6.13 sur Windows XP)
De temps en temps, je remarque un caractère étrange sur certaines pages Web lors de la navigation sur le Web. C'est le contour d'une boîte avec un nombre à 4 chiffres à l'intérieur.
Voici un exemple de page comportant ces caractères: http://aws.amazon.com/ec2/#highlights
Après chaque en-tête de section (Élastique, Complètement contrôlé, ...), je vois une boîte avec le numéro "0096" à l'intérieur. J'ai consulté la version mise en cache sur Google et Google l'a –
remplacée. J'imagine que je devrais y voir un tiret au lieu de la zone contenant les chiffres.
J'ai essayé de changer l'encodage des caractères dans Firefox, mais je n'ai pas réussi à en trouver un qui affiche correctement ces caractères.
Existe-t-il un moyen d'autoriser Firefox à visualiser ces caractères?
Merci d'avance!
Modifier - ajout d'une capture d'écran des caractères "spéciaux":
Edit # 2 - essayé dans Ubuntu - nouvelles images
Je me suis connecté à mon bureau Ubuntu et j'ai consulté la page amazon dans Chrome et Firefox. Chrome ignore complètement le caractère, même si j'inspecte ou visualise le code source de la page. Firefox dans Unbutu affiche le caractère exactement comme Firefox sur ma machine Windows XP. J'ai copié le personnage et joué avec elle sur la ligne de commande - voici une capture d'écran des résultats:
On dirait que je peux aussi coller le personnage dans ce post:
Ce n'est certainement pas isolé à Windows XP. J'ai essayé de définir l'encodage des caractères de mon terminal sur Windows 1252 (d'après le commentaire de Dennis ci-dessous), mais il n'affiche alors que ce caractère sous forme de point d'interrogation.
J'ai abaissé la page Web avec wget et curl, et les deux sorties affichent les caractères suivants: <96>
Je me demande si ce personnage rend correctement pour quelqu'un? Il semble que Webkit l'ignore simplement, mon IE6 l'ignore, Firefox affiche la boîte avec les chiffres. J'aurais dû imaginer que l'équipe de conception d'Amazon puisse le voir correctement?
Ce n’est pas un gros problème que ces personnages s’affiche correctement, mais il serait bon de savoir s’il existe une solution à ce problème.
la source
–
es. Ne voyez-vous que la boîte dans la copie en cache à laquelle vous ne créez pas de lien, ou également sur la page en direct?–
0xc296
, mais j'ai peut-être commis une erreur lors de la copie.Réponses:
0096 est très probablement une référence ASCII au caractère 'qui peut être affichée dans HTML comme
`
En regardant votre lien mais le HTML semble normal et il n'y a aucune référence à
–
Firefox ne devrait pas avoir de problèmes pour afficher le glyphe de tiret comme je viens de tester sur 3.6. * ...
... copiez et collez le code ci-dessus dans un document de test, nommez-le test.html et ouvrez-le dans Firefox. Il devrait afficher votre tiret sans aucun problème.
EDIT : Comme l'a souligné Dave 0x96, l'équivalent ANSI de en dash. Avec cette compréhension, il semble que ce soit un problème d'analyse en ce qui concerne la spécifiction doctype dans la page elle-même. Découvrez ce fil .
Vous pouvez extraire le code HTML et modifier le doctype pour voir s’il s’agit bien d’où provient le problème. Il s'agit probablement d'un croisement entre des valeurs codées, c'est-à-dire ... ANSI -> Unicode; En tant qu'Unicode, la valeur est un caractère non imprimable.
la source
–
quand il l'a mis en cache. Parce que si je visualise la source sur la page en direct sur Amazon, je reçois un caractère non imprimable. - ça ressemble à quelque chose comme ça:Â~V
Mais vous avez raison, Firefox n'affiche aucun problème–
0x96
(décimal 150) est un tiret en bas dans la page de code Windows 1252 .L'erreur semble être comme avec la page. Essayez de changer le codage de caractères en Windows-1252 dans Firefox pour voir si cela vous aide.
Beaucoup de pages Web mal configurées diront qu'elles sont ISO-8859-1 ou UTF-8 et qu'elles sont en réalité Windows-1252.
S'il s'agit d'une page que vous contrôlez, essayez de la sauvegarder et de spécifier un autre encodage.
la source
Â
place. J'ai enregistré une copie de la page sur mon propre serveur, modifié l'encodage en Windows-1252 et affiché également le caractèreÂ