Questions marquées «unicode»

Unicode est une norme de l'industrie informatique pour l'encodage, la représentation et la gestion cohérents du texte exprimé dans la plupart des systèmes d'écriture du monde.

54
Pourquoi printf "rétrécit-il" le tréma?

Si j'exécute le script simple suivant: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Il imprime: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz c'est-à-dire que le texte avec...

50
Filtrage de utf8 invalide

J'ai un fichier texte dans un encodage inconnu ou mixte. Je souhaite afficher les lignes contenant une séquence d'octets non valide UTF-8 (en transférant le fichier texte dans un programme). De manière équivalente, je veux filtrer les lignes qui sont valides UTF-8. En d'autres termes, je cherche...

38
Quelles polices conviennent aux glyphes Unicode

Alors, je regardais cette réponse sur stackoverflow et me suis rendu compte que mes polices ne couvraient pas une grande partie du spectre unicode utf-8 (car je reçois beaucoup de carrés). Est-ce que quelqu'un connaît une police qui couvrira tout ce

16
coreutils qui connaissent utf?

Lorsque j'ai utilisé cutaujourd'hui, j'ai découvert qu'il ne traitait pas un caractère UTF-8 comme un caractère, mais 3 caractères car il faisait 3 octets de long. Cela semble généralement vrai pour de nombreux outils. Existe-t-il des versions de l' coreutilsUTF-8? Ma localesortie: LANG=en_US.UTF-8...