Existe-t-il un moyen de déterminer le jeu de caractères utilisé pour un fichier de formes donné?
25
Essai et erreur. Essayez d'ouvrir le fichier .dbf avec Ms Excel ou avec OpenOffice en utilisant des paramètres différents jusqu'à ce que tout soit correct.
Regardez cet article pour plus d'indices: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Les programmes peuvent déterminer le jeu de caractères d'un fichier de formes de deux manières.
la source
L'
file
utilitaire est capable de deviner l'encodage d'un fichier texte. À utiliserogr2ogr
pour une conversion qui préserve l'encodage d'origine s'il n'y a pas de.cpg
fichier :Exemple de sortie:
Je l'ai testé avec deux des encodages les plus fréquents, UTF-8 et latin1. Fonctionne prêt à l'emploi dans Ubuntu, je ne suis pas sûr d'OS X. Je ne connais pas d'
file
utilitaire sous Windows.REMARQUE : dès qu'il y a un
.cpg
fichier correspondant qui indique l'encodage,ogr2ogr
l'honorera et la sortie sera en UTF-8. Mais si la sortie CSV semble correcte, vous savez que les informations contenues dans le.cpg
fichier sont exactes.la source
Une autre table pour convertir le 29e octet de * .dbf en page de codes: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm
la source