Pourquoi y a-t-il des caractères séparés de largeur fixe pour 0-9 en japonais, par rapport au 0-9 typique?

9

Japonais (日本語) -0123456789

ASCII typique pour partout ailleurs - 0 1 2 3 4 5 6 7 8 9

Pourquoi était-il nécessaire de créer un jeu de caractères distinct pour les mêmes chiffres?

Zaenille
la source

Réponses:

11

Ce sont des caractères pleine largeur .

  • Ces caractères, qui sont en Unicode U + FF00 à U + FFEF, sont destinés à être utilisés avec des caractères CJK. Ils existent pour que les caractères latins puissent s'aligner sur du texte CJK à largeur fixe. Historiquement, les caractères Han étaient définis en double largeur dans des terminaux 80x24, et ces caractères étaient utilisés pour correspondre à la largeur du texte CJK.

  • Ces caractères ne sont pas limités aux chiffres. L'alphabet latin complet est disponible sous forme pleine largeur.

    ABCDEFGHIJKLMNOPQRSTUVWXYZ
    abcdefghijklmnopqrstuvwxyz
    0123456789
    

Invite de commandes dans Windows montrant les formulaires pleine largeur pour les caractères latins aux côtés des caractères Han
Source d'image

bwDraco
la source
3

Ces caractères pleine largeur ne sont pas seulement pour le japonais mais aussi pour le coréen et le chinois car ils ont un jeu de caractères double largeur (alias pleine largeur). En raison de leur complexité visuelle et de la mauvaise résolution d'écran du passé, il n'était pas physiquement possible d'afficher ces langues en caractères demi-largeur - en particulier pour les caractères coréens et chinois.

(Le japonais a également des caractères à demi-largeur, mais en japonais, il est assez rare d'utiliser uniquement des caractères japonais. La plupart du temps, il vient avec des caractères chinois mélangés. Donc, avoir des caractères à demi-largeur n'aide pas beaucoup.)

Ces caractères numériques de grande taille ont été introduits pour cela. Quand ils écrivaient, par exemple, un texte de type tableau ou grille sans utiliser de graphiques, les caractères numériques typiques ne se mélangeaient pas bien. De plus, ils avaient des cultures d '«écriture verticale» ainsi que l'écriture horizontale que nous utilisons maintenant. Imaginez, si vous écrivez ces caractères verticalement, les caractères numériques conventionnels seront probablement laids lorsqu'ils sont mélangés.

Des choses similaires se produisaient également du côté de la structure de données car les caractères à demi-largeur prenaient 1 octet chacun tandis que les caractères à pleine largeur en faisaient 2 ou plus.

Faire en sorte que la plupart des personnages occupent le même espace et la même mémoire a simplifié beaucoup de choses comme celles-ci. De même, il existe également des caractères romains pleine largeur.

Je comprends en quelque sorte pourquoi vous avez posé cette question - de nos jours, tout est sur l'interface graphique. Les tableaux ne sont plus purement écrits dans des textes. Les écrits verticaux deviennent obsolètes. Pour avoir des caractères plus larges, nous pouvons simplement ajuster la largeur plutôt que d'utiliser des caractères gras. La plupart des caractères prennent de toute façon plusieurs octets lorsque des encodages plus complexes sont introduits. Il est donc peut-être vrai que ces caractères alphanumériques pleine largeur sont une sorte d'héritage de la vieillesse comme la touche "Scroll Lock" sur votre clavier.

Scott Rhee
la source
0

Je crois que cela a à voir avec la largeur des caractères et le japonais est l'une de ces langues où vous pouvez taper verticalement.

Nelson
la source