Comment puis-je dire à Firefox d'ignorer les caractères non imprimables?

4

Edit: Résumé

Apparemment, le caractère à afficher dans ce cas est un "tiret".

Cette page contient un tableau à mi-chemin qui indique que, pour –certains, un logiciel convertira le code hexadécimal correct de 2013 en 0096. (regardez la première ligne du tableau).

Cette réponse sur Stackoverflow explique qu'il s'agit en quelque sorte d'un mélange entre Windows-1252 et UTF-8.

Cet article de blog impose ceci:

Le caractère 150 (0x96) est le caractère unicode "START OF GUARDED AREA" dans la plage de caractères de contrôle C1 non affichée, mais dans l'encodage Windows-1252, il est mappé sur le caractère affichable 0x2013 "en-tiret" (un tiret court). .

D'autres ont eu du mal à produire ce contenu, car cette réponse sur Stackoverflow montre comment remplacer 0x0096 par 0x2013.

Google doit en être conscient, car, comme indiqué dans la question initiale ci-dessous, la version mise en cache de la page Amazon par Google –semble donc corriger automatiquement ces erreurs sur les pages mises en cache.

J'ai essayé de régler mon encodage sur Windows-1252, mais cela n'aide pas.

Alors maintenant, je suppose que ma question est la suivante: comment puis-je dire à Firefox d’ignorer des caractères non imprimables comme ceux-ci?


Contenu original ci-dessous:


(Firefox 3.6.13 sur Windows XP)

De temps en temps, je remarque un caractère étrange sur certaines pages Web lors de la navigation sur le Web. C'est le contour d'une boîte avec un nombre à 4 chiffres à l'intérieur.

Voici un exemple de page comportant ces caractères: http://aws.amazon.com/ec2/#highlights

Après chaque en-tête de section (Élastique, Complètement contrôlé, ...), je vois une boîte avec le numéro "0096" à l'intérieur. J'ai consulté la version mise en cache sur Google et Google l'a –remplacée. J'imagine que je devrais y voir un tiret au lieu de la zone contenant les chiffres.

J'ai essayé de changer l'encodage des caractères dans Firefox, mais je n'ai pas réussi à en trouver un qui affiche correctement ces caractères.

Existe-t-il un moyen d'autoriser Firefox à visualiser ces caractères?

Merci d'avance!

Modifier - ajout d'une capture d'écran des caractères "spéciaux":

texte alternatif

Edit # 2 - essayé dans Ubuntu - nouvelles images

Je me suis connecté à mon bureau Ubuntu et j'ai consulté la page amazon dans Chrome et Firefox. Chrome ignore complètement le caractère, même si j'inspecte ou visualise le code source de la page. Firefox dans Unbutu affiche le caractère exactement comme Firefox sur ma machine Windows XP. J'ai copié le personnage et joué avec elle sur la ligne de commande - voici une capture d'écran des résultats:

texte alternatif

On dirait que je peux aussi coller le personnage dans ce post:

Ce n'est certainement pas isolé à Windows XP. J'ai essayé de définir l'encodage des caractères de mon terminal sur Windows 1252 (d'après le commentaire de Dennis ci-dessous), mais il n'affiche alors que ce caractère sous forme de point d'interrogation.

J'ai abaissé la page Web avec wget et curl, et les deux sorties affichent les caractères suivants: <96>

Je me demande si ce personnage rend correctement pour quelqu'un? Il semble que Webkit l'ignore simplement, mon IE6 l'ignore, Firefox affiche la boîte avec les chiffres. J'aurais dû imaginer que l'équipe de conception d'Amazon puisse le voir correctement?

Ce n’est pas un gros problème que ces personnages s’affiche correctement, mais il serait bon de savoir s’il existe une solution à ce problème.

BrianH
la source
Quand je regarde la page et sa source, je ne vois aucune &ndash;es. Ne voyez-vous que la boîte dans la copie en cache à laquelle vous ne créez pas de lien, ou également sur la page en direct?
Daniel Beck
Sur la page en direct, je vois le caractère encadré. Je voulais savoir quel était le personnage, alors j'ai &ndash;
jeté un œil
La page a l'air drôle dans IE7 aussi, donc ce n'est pas un problème avec Firefox, à mon humble avis.
martineau
Certes, Safari l'a ignoré, mais lorsque je copie / colle et enregistre dans un éditeur de texte, c'est également étrange. Le code hexadécimal peut être 0xc296, mais j'ai peut-être commis une erreur lors de la copie.
Daniel Beck
J'ai trouvé cette page sur mozilla.com: support.mozilla.com/fr/questions/752866 - une réponse suggère que Firefox ne peut pas mapper un caractère sur une police. Je n'ai jamais changé la police par défaut dans Firefox. Je me demande quelle police Amazon est censée utiliser.
BrianH

Réponses:

0

0096 est très probablement une référence ASCII au caractère 'qui peut être affichée dans HTML comme &#96;

En regardant votre lien mais le HTML semble normal et il n'y a aucune référence à &ndash;

...

<p><span class="product_highlights">Elastic</span>  Amazon <span class="caps">EC2</span> enables you to increase or decrease capacity within minutes, not hours or days. You can commission one, hundreds or even thousands of server instances simultaneously. Of course, because this is all controlled with web service APIs, your application can automatically scale itself up and down depending on its needs.</p> 


    <p><span class="product_highlights">Completely Controlled</span>  You have complete control of your instances. You have root access to each one, and you can interact with them as you would any machine. You can stop your instance while retaining the data on your boot partition and then subsequently restart the same instance using web service APIs. Instances can be rebooted remotely using web service APIs. You also have access to console output of your instances.</p> 


    <p><span class="product_highlights">Flexible</span>  You have the choice of multiple instance types, operating systems, and software packages.  Amazon <span class="caps">EC2</span> allows you to select a configuration of memory, <span class="caps">CPU</span>, instance storage, and the boot partition size that is optimal for your choice of operating system and application.  For example, your choice of operating systems includes numerous Linux distributions, Microsoft Windows Server and OpenSolaris.</p> 

...

Firefox ne devrait pas avoir de problèmes pour afficher le glyphe de tiret comme je viens de tester sur 3.6. * ...

<html>
    <head>
        <body>
            My dash is &ndash;
        </body>
    </head>
</html>

... copiez et collez le code ci-dessus dans un document de test, nommez-le test.html et ouvrez-le dans Firefox. Il devrait afficher votre tiret sans aucun problème.

EDIT : Comme l'a souligné Dave 0x96, l'équivalent ANSI de en dash. Avec cette compréhension, il semble que ce soit un problème d'analyse en ce qui concerne la spécifiction doctype dans la page elle-même. Découvrez ce fil .

Vous pouvez extraire le code HTML et modifier le doctype pour voir s’il s’agit bien d’où provient le problème. Il s'agit probablement d'un croisement entre des valeurs codées, c'est-à-dire ... ANSI -> Unicode; En tant qu'Unicode, la valeur est un caractère non imprimable.

Aaron McIver
la source
Je pense que Google l'a converti &ndash;quand il l'a mis en cache. Parce que si je visualise la source sur la page en direct sur Amazon, je reçois un caractère non imprimable. - ça ressemble à quelque chose comme ça: Â~V Mais vous avez raison, Firefox n'affiche aucun problème&ndash;
BrianH
Voir mon commentaire à la question ci-dessus. Il suffit de copier et coller le code HTML dans un éditeur de texte pour afficher le caractère.
Daniel Beck
1
0x96(décimal 150) est un tiret en bas dans la page de code Windows 1252 .
Dennis Williamson
0

L'erreur semble être comme avec la page. Essayez de changer le codage de caractères en Windows-1252 dans Firefox pour voir si cela vous aide.

Beaucoup de pages Web mal configurées diront qu'elles sont ISO-8859-1 ou UTF-8 et qu'elles sont en réalité Windows-1252.

S'il s'agit d'une page que vous contrôlez, essayez de la sauvegarder et de spécifier un autre encodage.

Broam
la source
Oui, j'avais essayé de configurer Firefox pour qu'il utilise Windows-1252. Cela change le caractère à la Âplace. J'ai enregistré une copie de la page sur mon propre serveur, modifié l'encodage en Windows-1252 et affiché également le caractèreÂ
BrianH