En effet, dans de nombreuses polices, vous ne trouverez pratiquement aucune différence entre l’utilisation des caractères Unicode pour les chiffres romains et leur composition à partir de lettres latines standard. Par exemple, les représentations suivantes Louis VII
(haut) et Louis Ⅶ
(bas, utilisant des points de code pour les chiffres romains) sont rendues avec FreeSans:
Mis à part une toute petite différence d'espacement, qui n'était probablement pas intentionnelle, le résultat est identique.
Voici le même texte rendu avec DejaVu Sans:
Bien que les caractères semblent toujours identiques, il existe une différence d'espacement considérable. La question de savoir si ce dernier est préférable pour les chiffres romains est peut-être une question de goût, mais ce ne serait certainement pas un bon choix de crénage pour les majuscules ordinaires.
Linux Libertine va encore plus loin:
Ici, les chiffres romains sont légèrement plus petits que les lettres majuscules, ce qui correspond aux chiffres arabes de la police. Plus important encore, ils sont connectés, reproduisant une caractéristique souvent trouvée en chiffres romains dessinés à la main.
Maintenant, certains peuvent encore affirmer qu'il n'y a aucune amélioration dans ce qui précède ou qu'ils ne valent pas la peine. Donc, voici un cas où ne pas utiliser les caractères Unicode produira des résultats horribles:
(Notez que la petite taille des chiffres correspond à la composition historique réelle.) Il est possible que quelque chose de similaire se produise pour les polices de script ou les polices caligraphiques.
Sans points Unicode spécifiques pour les chiffres romains, la résolution de ce dernier problème ne serait possible qu'avec:
Utilisation d'une fonctionnalité OpenType complexe (ou similaire) qui tente de détecter si une séquence de lettres majuscules est un chiffre romain. Cela causera inévitablement des problèmes avec des mots qui seraient également un chiffre romain valide.
Utiliser une simple fonctionnalité OpenType, qui doit être activée manuellement pour chaque chiffre romain.
Utilisation de la zone à usage privé Unicode. Des problèmes de compatibilité risquent de survenir même lors du basculement entre deux polices prenant en charge les chiffres romains.
Du point de vue de l'Unicode, l'énorme différence sémantique entre les lettres latines majuscules et les chiffres romains aurait déjà suffi pour un codage séparé des chiffres romains.
TL; DR Le consortium Unicode recommande l’utilisation de la lettre latine, dans la mesure du possible, et non du chiffre, qui a été inclus pour des raisons de compatibilité avec la typographie est-asiatique.
L'histoire complète: (avec justification de l'affirmation ci-dessus)
À moins que vous ne fassiez une typographie est-asiatique, utiliser les caractères numériques non archaïques de Unicode (U + 2160 - U + 217F) est un hack.
Ces caractères ont été inclus pour assurer la compatibilité avec les normes est-asiatiques pré-Unicode. Ces caractères restent verticaux là où le texte est-asiatique est composé de haut en bas, alors qu'en général, le texte en caractères latins (par exemple, les noms) est écrit latéralement dans ce contexte.
Pour citer la dernière version de la norme Unicode (v 7.0, chap. 22, p. 20) :
Ainsi, en théorie, la distinction entre les chiffres romains et les lettres est une question de texte enrichi, comme l’italique, une modification de police ou des ligatures facultatives. Cela dit, comme le montre @Wrzlprmft, certaines polices l’utilisent pour éviter un changement de police pour chaque chiffre romain tout en conservant une bonne typographie.
L'existence d'un caractère pour XII et non pour XIII implique qu'il existe plusieurs encodages identiques, ce qui entraîne des difficultés pour la recherche de texte: si vous écrivez sur Louis XII et Louis XIII, vous écrirez probablement XIII sous la forme X + I + I + I, mais écrirez-vous XII en tant que personnage unique? Ou comme X + I + I pour avoir un affichage cohérent avec XIII? Il n’existe pas de bonne réponse à cette question lors de l’utilisation des caractères romains. C’est pourquoi le consortium Unicode recommande d’utiliser les lettres latines lorsque cela est possible et non les chiffres.
Edit: ajout de l' assertion TL; DR au début
la source
Du point de vue de l'apparence, il n'y aura peut-être pas beaucoup de différence. Donc, si vous ne publiez que des documents imprimés, il n'y a aucune différence, sauf dans certaines polices, comme le fait remarquer Wrzlprmft dans son excellente réponse.
La sémantique est importante
La différence sémantique est énorme. En utilisant des chiffres romains, cela indique clairement que vous parlez du chiffre 5 au lieu de la lettre V. Bien sûr, ils se ressemblent, mais ils signifient différents. Cela signifierait que le moteur de recherche pourrait avoir une chance plus grande de trouver "XX mark V" lorsque vous recherchez "XX version 5".
En fait, certaines choses fonctionnent mal parce que nous n'intégrons pas d'informations sémantiques. Le monde serait en effet un meilleur endroit si nous le voulions. Donc, utiliser le bon sens sémantique revient à peu près à utiliser les styles dans un traitement de texte par rapport au style manuellement. Il y a peu de différence sur le plan humain, mais une grande puissance en automatisation.
Les polices doivent faire des chiffres romains différents
Les fabricants de polices ne les utilisent pas vraiment car ils ne sont pas très souvent utilisés. Mais en les utilisant, vous pouvez obtenir les dalles en chiffres romains sur les lettres qui les différencient du texte. Donc, la fonctionnalité est sous-utilisée parce que c'est une utilisation rare. Les polices n'implémentent pas vraiment tout, et ne devraient pas l'être non plus. En utilisant ceux-ci, vous bénéficierez s'ils sont présents.
Conclusion
Tout cela est certainement un problème de type poule et œuf. Si des personnes n'utilisent pas les plages de caractères spéciales, aucune allocation spéciale n'est faite pour ces plages. Ainsi, les polices ne prendront pas en charge les littéraux romains spécialement conçus, car cela ne ferait que gaspiller des efforts en fonctionnalités que personne n'utilise. Il en va de même pour la recherche: si personne n'utilise les littéraux romains, aucun moteur de recherche ne trouvera de littéraux romains et la sémantique sera perdue. La sémantique souffre de ne pas adopter le sens sémantique correct. Cette même chose s’applique également à une gamme plus étendue de caractères Unicode.
En ce qui concerne la complexité de saisie, oui, la plupart des utilisateurs ne peuvent pas écrire de caractères étendus, mais ce n'est pas une excuse pour une personne bien informée qui l'ignore si cela a du sens. Si personne ne fait mieux les choses, aucun progrès ne sera jamais accompli. Enfer même mot a des modes pour écrire alpha en tapant / alpha. Il n’ya donc aucune raison pour qu’il ne soit pas facile de marquer les chiffres, ni même de les suggérer en tant que tels. Encore une fois, si personne ne le fait, il ne sera jamais adopté plus largement.
la source
<compat>
équivalents aux séquences correspondantes de lettres latines, ce qui suggère fortement que la seule raison pour laquelle ils sont en Unicode est la compatibilité aller-retour avec certains jeux de caractères hérités (probablement CJK) qui les possédaient. De tels caractères ne doivent généralement pas être utilisés, sauf pour les documents fidèlement contournés créés dans des codages traditionnels.