Questions marquées «unicode»

16

Comment convertir des chiffres persans en UTF-8 en chiffres européens en ASCII?

En chiffres persans, ۰۱۲۳۴۵۶۷۸۹équivaut à 0123456789des chiffres européens. Comment convertir le nombre persan (in UTF-8) en ASCII? Par exemple, je veux ۲۱devenir

bash unicode conversion

15

Noms de fichiers UTF 8?

Dans les systèmes d'exploitation basés sur Unix, les noms de fichiers utf6 sont-ils autorisés? Si c'est le cas, je dois faire quelque chose de spécial pour écrire le fichier sur le disque. Permettez-moi d'expliquer ce que j'espère faire. J'écris une application qui transférera un fichier via ftp...

linux filenames unicode

15

Obtenir la largeur d'affichage d'une chaîne de caractères

Quel serait le plus proche d'un moyen portable pour obtenir la largeur d'affichage (sur un terminal au moins (celui qui affiche les caractères dans les paramètres régionaux actuels avec la bonne largeur)) d'une chaîne de caractères à partir d'un script shell. Je m'intéresse principalement à la...

shell-script unicode

15

Vous ne pouvez pas utiliser `cut -c` (` --characters`) avec UTF-8?

La commande cuta une option -cpour travailler sur des caractères, au lieu d'octets avec l'option -b. Mais cela ne semble pas fonctionner, en en_US.UTF-8locale: Le deuxième octet donne le deuxième caractère ASCII (qui est codé de la même manière en UTF-8): $ printf 'ABC' | cut -b 2 B mais ne donne...

text-processing character-encoding unicode cut

14

grep: Trouver toutes les lignes contenant des kanjis japonais

Dans un énorme fichier texte UTF-8, je veux montrer toutes les lignes qui contiennent des kanjis japonais . Quelle grep(ou autre) expression cela fait-il? Si je ne me trompe pas, les kanjis sont les caractères entre \u4e00et \u4dbf. Je n'ai pas besoin de montrer des kanas , mais les montrer ne...

grep unicode

14

Comment puis-je taper des caractères Unicode dans le terminal Konsole de KDE à partir d'un bureau Gnome?

J'utilise Ubuntu .. Dans 'gnome-terminal', je peux taper des codes codés Unicode en tapant d'abord Ctrl-Shift-u suivi de la valeur hexadécimale Codepoint, par exemple. C-S-u 2468produit ⑨ konsole, mon terminal préféré, n'a pas cette fonctionnalité CSu (gnome) .. Existe-t-il un moyen KDE équivalent...

kde keyboard unicode konsole input-method

14

iconv séquence d'entrée illégale - pourquoi?

En essayant de convertir un fichier texte en son équivalent ASCII, j'obtiens un message d'erreur iconv: illegal input sequence at position. La commande que j'utilise est iconv -f UTF-8 -t ascii//TRANSLIT file Le caractère fautif est æ. Le fichier texte lui-même est présent ici . Pourquoi dit-on...

text-processing character-encoding unicode

13

Vim peut-il afficher uniquement des caractères ASCII et traiter les autres octets comme des données binaires?

Je sais déjà vim -b, cependant, selon les paramètres régionaux utilisés, il affiche les caractères multi-octets (comme UTF-8) sous forme de lettres simples. Comment puis-je demander vimd'afficher uniquement les caractères imprimables ASCII et de traiter le reste comme des données binaires, quel que...

vim character-encoding unicode binary ascii

12

Comment puis-je faire fonctionner les symboles Unicode et les polices TrueType dans xterm / uxterm?

Je voudrais utiliser une police TrueType dans xterm / uxterm (version 278) mais je rencontre des problèmes avec les symboles Unicode (par exemple, s'affiche très bien, donc je suppose que ce n'est pas un utf8 désactivé ou un problème de paramètres régionaux): $ echo -e "\xE2\x98\xA0" me donne un...

fonts xterm unicode ttf

12

Comment imprimer les noms de glyphes Unicode pour la chaîne d'entrée?

J'aimerais pouvoir courir unicode-names 'abç' et voir les noms de caractères Unicode correspondants: LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA L'impression d'une chaîne sous la forme d'une série de noms de glyphes Unicode serait utile dans plusieurs cas: Distinguez...

command-line unicode

11

prise en charge de l'encodage utf-8 avec lpr

Lors de la tentative d'envoi d'un fichier texte à l'imprimante via lprfrom xterm, le contenu a été corrompu au-delà de la reconnaissance, dont la cause a finalement été attribuée à l'encodage du fichier. Si je traite plutôt le texte avec iconv(par exemple, iconv -f utf-8 -t ascii//TRANSLIT), le...

cups character-encoding unicode lpr

11

Symboles mathématiques UTF8 et disposition / entrée du clavier

Je voudrais utiliser des symboles mathématiques UTF8, lors de la saisie d' une liste , d' une autre liste . J'ai trouvé quelque chose appelé ComposeKey . Malheureusement, il ne couvre pas les oméga, thêta, flèche droite, etc. J'utilise KDE, j'ai essayé des raccourcis globaux, mais ne semble pas...

xorg kde keyboard keyboard-layout unicode

11

Comment savoir quels points de code Unicode sont définis dans un fichier TTF?

J'ai besoin d'automatiser un processus de vérification pour savoir quels caractères Unicode ont des glyphes réels définis pour eux dans un fichier de police True Type. Comment puis-je faire ça? Je n'arrive pas à trouver des informations sur la façon de comprendre les chiffres que je semble obtenir...

fonts unicode ttf

10

Comment identifier un personnage étrange?

J'essaie d'identifier un personnage étrange que j'ai trouvé dans un fichier avec lequel je travaille: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 Le fichier utilise le codage ISO-8859 et ne peut pas être converti en UTF-8: $...

character-encoding unicode

10

Détectez la quantité d'Unicode prise en charge par mon terminal, même via l'écran

Voici le problème: je veux pouvoir discerner si mon terminal est capable d'unicode décent ou non, afin d'utiliser certains caractères ou non, tout comme les regards, qui utilise parfois des couleurs et d'autres soulignent. La motivation vient du fait que dans tout type de terminal virtuel, je...

linux terminal tty unicode

10

Où est passée ma ligne `uniq` ou` sort -u`, avec quelques caractères unicode

Que se passe-t-il dans l'extrait de code suivant? Je n'obtiens pas la sortie attendue. Je pense que c'était un bug, mais cela arrive pour 2 programmes différents (uniq et sort), donc je soupçonne que c'est quelque chose à voir avec ... eh bien, je ne sais pas quoi ... d'où la question. Les 3...

text-processing sort locale unicode uniq

10

Traiter un fichier commençant par une nomenclature (FF FE)

J'ai reçu un fichier .csv avec la FF FEnomenclature: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| Lorsque awkj'utilise pour l'analyser, je reçois un tas d'octets nuls, ce qui, je le soupçonne, est dû à l'ordre des octets. Comment puis-je...

text-processing character-encoding unicode

10

Comment convertir des fichiers txt UTF-8 en majuscules en bash?

J'ai des fichiers .txt UTF-8 que je voudrais convertir en majuscules. Si c'était juste ASCII, je pourrais utiliser: tr [:lower:] [:upper:] Mais comme je travaille avec des signes diacritiques et d'autres choses, cela ne semble pas fonctionner. Je suppose que cela pourrait fonctionner si je définis...

locale unicode text tr

10

Spécifiez l'encodage avec libreoffice --convert-to csv

Les fichiers Excel peuvent être convertis en CSV en utilisant: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Tout semble bien fonctionner. L'encodage, cependant, est réglé sur quelque chose de chancelant. Au lieu d'un mdash UTF-8 (-) que j'obtiens si je fais un "enregistrer sous"...

character-encoding unicode conversion libreoffice

9

Comment changer la police de la console bash pour afficher les caractères UTF-8

J'ai du mal à afficher correctement les caractères UTF-8 sur bash. J'essayais d'extraire des fichiers compressés contenant des caractères accentués dans leurs noms, et j'obtenais l'erreur de caractères multi-octets non valide. J'ai créé un .bash_profileavec ceci: export LANG=en_US.UTF-8 export...

bash unicode