Connaissez-vous de bonnes ressources sur les algorithmes de géocodage?
Je suis particulièrement intéressé par l'analyse des requêtes d'adresses, y compris la correspondance et la pondération des parties de la requête, le traitement des fautes d'orthographe et des variations, ainsi que les détails sur le stockage des données physiques (par exemple, les schémas pour les requêtes de bases de données relationnelles directes, les approches d'indexation des données, etc.) .
J'ai étudié certains documents sur le géocodage d'ArcGIS 10, mais ils touchent un peu les détails de l'implémentation réelle. Une documentation détaillée d'autres implémentations de production de haute qualité pourrait également être utile. Plus c'est technique, mieux c'est. Les articles d'algorithmes théoriques sont également excellents.
Merci.
Le papier auquel Mapperz est lié est très bon et contient beaucoup de citations qui seront probablement intéressantes, mais je ne pense pas qu'elles décrivent très bien la correspondance des chaînes et son importance dans le processus de géocodage. Ils ont mentionné brièvement Soundex , mais Soundex n'est pas la seule option et même pas la meilleure option pour les adresses IMO. Ils ont énuméré un bon nombre de citations qui sont pertinentes au sujet, donc ces articles vous intéresseront.
Ce fil sur le site d'échange de statistiques parle de correspondance floue de deux ensembles de chaînes, et toutes les mêmes techniques s'appliquent lors de la correspondance d'adresses. En particulier, je pense que l'utilisation de distances de montage est plus logique que Soundex, en particulier avec les détails d'adresse qui n'ont pas d'analogique Soundex. Le calcul de la distance Levenshtein entre deux chaînes n'est pas si compliqué, et ce sont de nombreux exemples flottant sur Internet (en voici un en Python).
Je viens de passer la dernière heure à essayer de trouver comment ESRI implémente leur sensibilité à l'orthographe et leurs différents scores de candidats et de correspondances. Je n'ai trouvé que des descriptions simples (les meilleures de celles que j'ai trouvées dans ce PDF et la section d'aide en ligne de 9.3 ). Donc, si quelqu'un peut me diriger vers une documentation plus détaillée, je serais reconnaissant ainsi que l'OP.
la source
L'Université de Caroline du Sud dispose de services de traitement d'adresses et de géocodage pour lesquels elle a publié certains détails techniques. Ils ont beaucoup de bonnes références sur leur site.
la source
La liste de diffusion GEOREFERENCING fournie par UK JISC https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING
Mon blog (section de géocodage) contient un article occasionnel sur le géocodage et la résolution des toponymes (son cousin non structuré): http://bit.ly/lQ0Sjs
la source
Une bonne ressource pour étudier le géocodage https://webgis.usc.edu/Services/Geocode/About/TechnicalDetails.aspx
la source