Quel est l'encodage de caractères utilisé par le fichier dbf dans les shapefiles? Il semble que le traitement soit différent, en fonction du programme et des paramètres de codage locaux de la machine. Quel est le bon encodage - spécifié pour le format?
52
Réponses:
La norme DBF d'origine définit l'utilisation d' ISO8859-1 et uniquement d'ISO8859-1. Ainsi, lorsque vous obtenez un fichier de formes conforme aux normes, il devrait être ISO8859-1. Bien sûr, cette (très ancienne) restriction n’est pas vraiment utilisable de nos jours.
ArcGIS et Geopublisher, AtlasStyler et Geoserver ont commencé à étendre la norme pour définir le codage. Pour ArcGIS , par exemple, créez simplement un fichier .cpg (portant le même nom de base que les autres fichiers de formes) et remplissez-le avec le nom de l'encodage.
Par exemple, créez un fichier myshape.cpg avec un éditeur de texte et insérez 5 caractères "UTF-8" et enregistrez-le. Si vous ouvrez ensuite le fichier de forme dans ArcGIS, il lit le contenu textuel du DBF dans ce jeu de caractères.
Geoserver: Geoserver WFS peut exporter n'importe quelle couche WFS sous forme de fichier de forme zippé. Lorsque cela est fait, un fichier .cst est contenu dans le zip, faisant exactement la même chose que le fichier .cpg.
Attention: Tout cela ne concerne que les données, pas les noms de colonnes. Vous ne devriez utiliser ASCII que dans les noms de colonne d'un fichier DBF si vous voulez que le fichier puisse être ouvert avec d'autres programmes.
Astuce: pour changer l'encodage d'un DBF, ouvrez-le avec OpenOffice Calc .. choisissez SaveAs ... cliquez sur "Options de filtrage" en bas à gauche et appuyez sur Enregistrer. Vous pouvez ensuite définir le codage pour convertir le contenu du texte en.
la source
General input/output error
vous n'avez probablement pas installé Base . Le problème est le même que vous utilisiez OpenOffice ou LibreOffice..cpg
fichier est supposé fonctionner correctement dans QGIS, également, à partir de libgdal 1.9. Parfois, cela semble même être nécessaire: ssrebelious.wordpress.com/2012/03/11/…Je suis à peu près sûr qu'il n'y a pas d'encodage "correct". Un fichier .dbf peut être dans n'importe quel encodage et vous pourrez ouvrir le Shapefile et lire les attributs correctement si vous le connaissez.
Vous pouvez trouver le livre blanc ESRI ici: http://www.esri.com/library/whitepapers/pdfs/shapefile.pdf
Je m'attends généralement à ce qu'un fichier de formes soit au format UTF-8 ou local du pays couvert (souvent un codage en latin).
la source
Chaque fois que je vois une question sur le codage, je renvoie les gens à cet article: http://www.joelonsoftware.com/articles/Unicode.html
Comme il est dit:
la source
Un moyen simple est de convertir un fichier shp en fichier csv. Et utilisez enca ou iconv pour détecter l'encodage. J'ai essayé avec les fichiers UTF8 et gb18030 et cela fonctionne.
la source