Pourquoi Google Docs change-t-il le titre de mon document en caractères chinois?

8

Lorsque j'ouvre un fichier pdf à partir d'un e-mail (cela se produit sur certains pdfs mais pas sur tous), Google Docs propose le titre correct tout en affichant l'aperçu de mon document. Puis une seconde plus tard, il change le titre en chinois.

Cela se produit à la fois dans Firefox et Chrome.

Avant: texte alternatif

Après: texte alternatif

Voici un autre exemple de texte anglais:

JS 6.10.pdf - Propulsé par Google Docs

Voici le chinois réel, il le transforme en:

㽉 㽮 㽴 㽵 㽩 㽴 㽟 㽑 㽂 㽏 㽂 㽟 㽉 㽮 㽴 㽥 㽲 㽮 㽡 㽬 㼮 㽰 㽤 㽦

Michael Pryor
la source
Peut-être un problème d'encodage? Voyez-vous cela dans tous les navigateurs?
ale
Je vois cela aussi depuis le matin d'aujourd'hui. Étrange.
néo
Est-il possible que Google rencontre actuellement un problème de géocodage? Il semble que Google traite votre ordinateur comme dans un autre pays.
Ben Hoffman
@randomben Adobe pense parfois que je suis allemand pour une raison quelconque. Hrm.
Michael Pryor
Ils ont déjà eu des problèmes avec des hackers chinois et Google Apps avant ...
Evan Carroll

Réponses:

1

Je vois quelque chose de similaire. Il semble qu'il existe deux sections du fichier qui ne sont pas correctement encodées en UTF-8:

00003c0: 3c2f 7363 7269 7074 3e0a 0a0a 3c74 6974  </script>...<tit
00003d0: 6c65 3ee3 bd90 e3bd 8fe3 bd89 e3bd 8ee3  le>.............
00003e0: bd94 e3bc a0e3 bd84 e3bd afe3 bda3 e3bd  ................
00003f0: b5e3 bdad e3bd a5e3 bdae e3bd b420 2d20  ............. -
0000400: 506f 7765 7265 6420 6279 2047 6f6f 676c  Powered by Googl
0000410: 6520 446f 6373 3c2f 7469 746c 653e 0a3c  e Docs</title>.<


0003560: 2d6c 6566 7422 3e3c 6469 7620 636c 6173  -left"><div clas
0003570: 733d 2274 6974 6c65 2067 6f6f 672d 696e  s="title goog-in
0003580: 6c69 6e65 2d62 6c6f 636b 223e e3bd 90e3  line-block">....
0003590: bd8f e3bd 89e3 bd8e e3bd 94e3 bca0 e3bd  ................
00035a0: 84e3 bdaf e3bd a3e3 bdb5 e3bd ade3 bda5  ................
00035b0: e3bd aee3 bdb4 3c2f 6469 763e 0a3c 6469  ......</div>.<di

Je n'ai pas encore compris quel encodage il est censé être.

Ben Gartner
la source