En chiffres persans, ۰۱۲۳۴۵۶۷۸۹équivaut à 0123456789des chiffres européens. Comment convertir le nombre persan (in UTF-8) en ASCII? Par exemple, je veux ۲۱devenir
En chiffres persans, ۰۱۲۳۴۵۶۷۸۹équivaut à 0123456789des chiffres européens. Comment convertir le nombre persan (in UTF-8) en ASCII? Par exemple, je veux ۲۱devenir
Dans les systèmes d'exploitation basés sur Unix, les noms de fichiers utf6 sont-ils autorisés? Si c'est le cas, je dois faire quelque chose de spécial pour écrire le fichier sur le disque. Permettez-moi d'expliquer ce que j'espère faire. J'écris une application qui transférera un fichier via ftp...
Quel serait le plus proche d'un moyen portable pour obtenir la largeur d'affichage (sur un terminal au moins (celui qui affiche les caractères dans les paramètres régionaux actuels avec la bonne largeur)) d'une chaîne de caractères à partir d'un script shell. Je m'intéresse principalement à la...
La commande cuta une option -cpour travailler sur des caractères, au lieu d'octets avec l'option -b. Mais cela ne semble pas fonctionner, en en_US.UTF-8locale: Le deuxième octet donne le deuxième caractère ASCII (qui est codé de la même manière en UTF-8): $ printf 'ABC' | cut -b 2 B mais ne donne...
Dans un énorme fichier texte UTF-8, je veux montrer toutes les lignes qui contiennent des kanjis japonais . Quelle grep(ou autre) expression cela fait-il? Si je ne me trompe pas, les kanjis sont les caractères entre \u4e00et \u4dbf. Je n'ai pas besoin de montrer des kanas , mais les montrer ne...
J'utilise Ubuntu .. Dans 'gnome-terminal', je peux taper des codes codés Unicode en tapant d'abord Ctrl-Shift-u suivi de la valeur hexadécimale Codepoint, par exemple. C-S-u 2468produit ⑨ konsole, mon terminal préféré, n'a pas cette fonctionnalité CSu (gnome) .. Existe-t-il un moyen KDE équivalent...
En essayant de convertir un fichier texte en son équivalent ASCII, j'obtiens un message d'erreur iconv: illegal input sequence at position. La commande que j'utilise est iconv -f UTF-8 -t ascii//TRANSLIT file Le caractère fautif est æ. Le fichier texte lui-même est présent ici . Pourquoi dit-on...
Je sais déjà vim -b, cependant, selon les paramètres régionaux utilisés, il affiche les caractères multi-octets (comme UTF-8) sous forme de lettres simples. Comment puis-je demander vimd'afficher uniquement les caractères imprimables ASCII et de traiter le reste comme des données binaires, quel que...
Je voudrais utiliser une police TrueType dans xterm / uxterm (version 278) mais je rencontre des problèmes avec les symboles Unicode (par exemple, s'affiche très bien, donc je suppose que ce n'est pas un utf8 désactivé ou un problème de paramètres régionaux): $ echo -e "\xE2\x98\xA0" me donne un...
J'aimerais pouvoir courir unicode-names 'abç' et voir les noms de caractères Unicode correspondants: LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA L'impression d'une chaîne sous la forme d'une série de noms de glyphes Unicode serait utile dans plusieurs cas: Distinguez...
Lors de la tentative d'envoi d'un fichier texte à l'imprimante via lprfrom xterm, le contenu a été corrompu au-delà de la reconnaissance, dont la cause a finalement été attribuée à l'encodage du fichier. Si je traite plutôt le texte avec iconv(par exemple, iconv -f utf-8 -t ascii//TRANSLIT), le...
Je voudrais utiliser des symboles mathématiques UTF8, lors de la saisie d' une liste , d' une autre liste . J'ai trouvé quelque chose appelé ComposeKey . Malheureusement, il ne couvre pas les oméga, thêta, flèche droite, etc. J'utilise KDE, j'ai essayé des raccourcis globaux, mais ne semble pas...
J'ai besoin d'automatiser un processus de vérification pour savoir quels caractères Unicode ont des glyphes réels définis pour eux dans un fichier de police True Type. Comment puis-je faire ça? Je n'arrive pas à trouver des informations sur la façon de comprendre les chiffres que je semble obtenir...
J'essaie d'identifier un personnage étrange que j'ai trouvé dans un fichier avec lequel je travaille: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 Le fichier utilise le codage ISO-8859 et ne peut pas être converti en UTF-8: $...
Voici le problème: je veux pouvoir discerner si mon terminal est capable d'unicode décent ou non, afin d'utiliser certains caractères ou non, tout comme les regards, qui utilise parfois des couleurs et d'autres soulignent. La motivation vient du fait que dans tout type de terminal virtuel, je...
Que se passe-t-il dans l'extrait de code suivant? Je n'obtiens pas la sortie attendue. Je pense que c'était un bug, mais cela arrive pour 2 programmes différents (uniq et sort), donc je soupçonne que c'est quelque chose à voir avec ... eh bien, je ne sais pas quoi ... d'où la question. Les 3...
J'ai reçu un fichier .csv avec la FF FEnomenclature: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| Lorsque awkj'utilise pour l'analyser, je reçois un tas d'octets nuls, ce qui, je le soupçonne, est dû à l'ordre des octets. Comment puis-je...
J'ai des fichiers .txt UTF-8 que je voudrais convertir en majuscules. Si c'était juste ASCII, je pourrais utiliser: tr [:lower:] [:upper:] Mais comme je travaille avec des signes diacritiques et d'autres choses, cela ne semble pas fonctionner. Je suppose que cela pourrait fonctionner si je définis...
Les fichiers Excel peuvent être convertis en CSV en utilisant: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Tout semble bien fonctionner. L'encodage, cependant, est réglé sur quelque chose de chancelant. Au lieu d'un mdash UTF-8 (-) que j'obtiens si je fais un "enregistrer sous"...
J'ai du mal à afficher correctement les caractères UTF-8 sur bash. J'essayais d'extraire des fichiers compressés contenant des caractères accentués dans leurs noms, et j'obtenais l'erreur de caractères multi-octets non valide. J'ai créé un .bash_profileavec ceci: export LANG=en_US.UTF-8 export...