J'ai utilisé ceci: u = unicode(text, 'utf-8') Mais obtenir une erreur avec Python 3 (ou ... peut-être que j'ai juste oublié d'inclure quelque chose): NameError: global name 'unicode' is not defined Je vous remercie.
J'ai utilisé ceci: u = unicode(text, 'utf-8') Mais obtenir une erreur avec Python 3 (ou ... peut-être que j'ai juste oublié d'inclure quelque chose): NameError: global name 'unicode' is not defined Je vous remercie.
En travaillant avec Python 2.7, je me demande quel avantage réel il y a à utiliser le type à la unicodeplace de str, car les deux semblent être capables de contenir des chaînes Unicode. Existe-t-il une raison particulière en dehors de la possibilité de définir des codes Unicode dans des...
Je lance cet extrait deux fois, dans le terminal Ubuntu (encodage défini sur utf-8), une fois avec ./test.pypuis avec ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Sans redirection, il imprime des déchets. Avec la redirection, j'obtiens un UnicodeDecodeError. Quelqu'un...
Je travaille avec un fichier .txt. Je veux une chaîne du texte du fichier sans caractères non ASCII. Cependant, je veux laisser des espaces et des périodes. Pour le moment, je les dépouille aussi. Voici le code: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return...
Python trie par valeur d'octet par défaut, ce qui signifie que é vient après z et d'autres choses tout aussi amusantes. Quelle est la meilleure façon de trier par ordre alphabétique en Python? Y a-t-il une bibliothèque pour cela? Je n'ai rien trouvé. De préférence, le tri doit prendre en charge la...
Existe-t-il une fonction en PHP qui peut décoder des séquences d'échappement Unicode comme " \u00ed" to " í" et toutes les autres occurrences similaires? J'ai trouvé une question similaire ici mais cela ne semble pas
J'essaie de trouver le symbole Unicode pour qu'un bouton affiche le symbole de pause Unicode. J'ai pu constater que le symbole de lecture Unicode est ►mais je recherche l'équivalent du symbole de pause
U + 4E00..U + 9FFF fait partie de l'ensemble complet, mais pas tous
Il existe deux façons d'ouvrir un fichier texte en Python: f = open(filename) Et import codecs f = codecs.open(filename, encoding="utf-8") Quand est-il codecs.openpréférable open?
Je tombe dans un problème surprenant. J'ai chargé un fichier texte dans mon application et j'ai une logique qui compare la valeur ayant µ. Et j'ai réalisé que même si les textes sont identiques, la valeur de comparaison est fausse. Console.WriteLine("μ".Equals("µ")); // returns false...
Quelle pourrait être la cause de cette erreur lorsque j'essaie d'insérer un caractère étranger dans la base de données? >>UnicodeEncodeError: 'latin-1' codec can't encode character u'\u201c' in position 0: ordinal not in range(256) Et comment résoudre ce problème? Merci!...
J'ai expérimenté divers bits de code Java pour essayer de trouver quelque chose qui encodera une chaîne contenant des guillemets, des espaces et des caractères Unicode "exotiques" et produira une sortie identique à la fonction encodURIComponent de JavaScript . Ma chaîne de test de torture est: "A"...
Quel (s) symbole (s) de caractère Unicode expriment la durée (comme une horloge, un sablier ou une autre montre)? Par exemple "★ 3⅔" au lieu de "3 heures et quarante minutes", où ★ est un symbole de temps.
กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็...
En utilisant SQLite3 en Python, j'essaie de stocker une version compressée d'un extrait de code HTML UTF-8. Le code ressemble à ceci: ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid,...
J'écris un webservice qui utilise json pour représenter ses ressources, et je suis un peu coincé en réfléchissant à la meilleure façon d'encoder le json. En lisant le json rfc ( http://www.ietf.org/rfc/rfc4627.txt ), il est clair que l'encodage préféré est utf-8. Mais le rfc décrit également un...
Je veux simplement afficher les symboles de coche (✔) et de croix (✘) dans une page HTML, mais cela apparaît sous forme de boîte ou de goop - évidemment quelque chose à voir avec l'encodage. J'ai défini la balise meta pour afficher utf-8 mais il me manque évidemment quelque chose. <meta...
Fermé. Cette question ne respecte pas les directives de Stack Overflow . Il n'accepte pas les réponses actuellement. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle soit pertinente pour Stack Overflow. Fermé il y a 3 ans . Améliorez cette question Nous avons donc la...
Ce qui suit remplacera les caractères de contrôle ASCII (raccourci pour [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); Ce qui suit remplacera tous les caractères ASCII non imprimables (raccourci pour [\p{Graph}\x20]), y compris les caractères accentués:
Je suis nouveau dans la programmation Windows et après avoir lu le livre Petzold, je me demande: est-ce toujours une bonne pratique d'utiliser le TCHARtype et la _T()fonction pour déclarer des chaînes ou si je devrais simplement utiliser les chaînes wchar_tet L""dans le nouveau code? Je ciblerai...