Questions marquées «utf-8»

143
Changer l'encodage par défaut de Python?

J'ai de nombreux problèmes "impossible d'encoder" et "impossible de décoder" avec Python lorsque j'exécute mes applications depuis la console. Mais dans l' IDE Eclipse PyDev , l'encodage de caractères par défaut est défini sur UTF-8 , et ça va. J'ai cherché partout pour définir l'encodage par...

137
Différence entre UTF-8 et UTF-16?

Différence entre UTF-8 et UTF-16? Pourquoi en avons-nous besoin? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

135
Caractères Unicode dans les URL

En 2010, diffuseriez-vous des URL contenant des caractères UTF-8 dans un grand portail Web? Les caractères Unicode sont interdits selon la RFC sur les URL (voir ici ). Ils devraient être codés en pourcentage pour être conformes aux normes. Mon point principal, cependant, est de servir les...

122
Pourquoi déclarer unicode par chaîne en python?

J'apprends toujours python et j'ai un doute: En python 2.6.x, je déclare généralement le codage dans l'en-tête du fichier comme ceci (comme dans PEP 0263 ) # -*- coding: utf-8 -*- Après cela, mes chaînes sont écrites comme d'habitude: a = "A normal string without declared Unicode" Mais chaque fois...

110
FIXER LES NOMS utf8 dans MySQL?

Je vois souvent quelque chose de similaire ci-dessous dans les scripts PHP utilisant MySQL query("SET NAMES utf8"); Je n'ai encore jamais eu à faire cela pour aucun projet, alors j'ai quelques questions de base à ce sujet. Est-ce quelque chose qui se fait uniquement avec PDO? Si ce n'est pas une...

110
Comment puis-je sortir UTF-8 depuis Perl?

J'essaye d'écrire un script Perl en utilisant le pragma "utf8" et j'obtiens des résultats inattendus. J'utilise Mac OS X 10.5 (Leopard) et j'édite avec TextMate. Tous mes paramètres pour mon éditeur et mon système d'exploitation sont définis par défaut sur l'écriture de fichiers au format utf-8....

109
ruby 1.9: séquence d'octets invalide en UTF-8

J'écris un robot d'exploration en Ruby (1.9) qui consomme beaucoup de HTML provenant de nombreux sites aléatoires. En essayant d'extraire des liens, j'ai décidé d'utiliser simplement à la .scan(/href="(.*?)"/i)place de nokogiri / hpricot (accélération majeure). Le problème est que je reçois...