Déterminer un nombre inconnu d'emplacements du monde réel à partir de rapports basés sur le GPS

9

Je travaille sur un logiciel qui devrait déterminer les emplacements du monde réel (par exemple, les radars) à partir de plusieurs rapports basés sur le GPS . Un utilisateur conduira lorsqu'il signalera un emplacement, ce qui rend les rapports très inexacts. Pour résoudre ce problème, je dois regrouper les rapports sur le même emplacement et calculer une moyenne.

Ma question est de savoir comment regrouper ces rapports . J'ai lu sur les algorithmes de maximisation des attentes et le clustering k-means , mais si j'ai bien compris, je devrais déterminer à l'avance le nombre d'emplacements réels.

Existe-t-il d'autres algorithmes, qui n'ont pas besoin du nombre exact d'emplacements réels, mais utilisent à la place des conditions de bord (par exemple une distance minimale)?

Un rapport contient la longitude , la latitude et la précision (en mètres). Il n'y a aucun nom ou autre qui pourrait être utilisé pour identifier les doublons.

Un autre obstacle pourrait être qu'il sera commun, qu'il n'y a qu'un seul rapport pour un emplacement réel. Il est donc difficile de distinguer les valeurs aberrantes des bonnes données.

Christian Strempfer
la source
1
Je ne suis pas sûr de ce que vous voulez dire lorsque vous dites "... si j'ai bien compris, je devrais déterminer le nombre de lieux réels à l'avance ..." En supposant que je vous ai bien compris, il n'y a rien dans les algorithmes qui nécessite par nature cette. Envisagez-vous peut-être d'augmenter le nombre de composants de cluster en fonction du nombre de rapports?
Pat
1
2ème question :). Si vos rapports proviennent de quelqu'un qui conduit, il y aura peut-être des changements de position importants entre eux. Les rapports sont-ils accompagnés d'un horodatage vous indiquant quand ils ont été pris?
Pat
2
Salut Pat. Je parle des embouteillages ou des radars pour que ce soit plus clair. 1. Le "k" dans le clustering k-signifie le nombre de clusters. Dans mon cas, j'aurais un cluster pour chaque emplacement, alors que je ne sais pas combien d'emplacements différents il y a. 2. Oui, ils incluent également un horodatage. Mais je ne comprends pas pourquoi cela devrait être important, car je ne me soucie que du poste.
Christian Strempfer
1
1. Ahh, je vois. Vous disposez donc d'un nombre inconnu de sites et chaque site génère un ou plusieurs rapports. Cependant, tout ce que vous voyez est un flux de rapports. Vous souhaitez déduire le nombre d'emplacements et leur position en fonction des rapports observés. Je l'ai? 2. Je me inquiète horodatages parce que vous dites que l'utilisateur sera conduite quand ils donnent un rapport. En tant que tel, à moins que les rapports ne se succèdent très rapidement ou que la vitesse soit très faible (possible, s'il s'agit d'un embouteillage), un seul emplacement ressemblera à une ligne irrégulière de rapports suivant la route. Les horodatages peuvent être utiles ici
Pat
1
1. Oui, vous l'avez. 2. C'est une tâche manuelle, donc un emplacement ne doit être signalé qu'une seule fois par utilisateur au cours d'un voyage. Mais vous avez raison, je dois gérer les doublons, lorsqu'un utilisateur clique accidentellement deux fois, et les rapports seront inexacts lors de la conduite rapide. C'est pourquoi j'ai mentionné la condition de bord d'une distance minimale entre les emplacements. Ignorons les embouteillages, qui pourraient s'étendre sur quelques kilomètres, et supposons qu'un emplacement est très petit.
Christian Strempfer

Réponses:

1

J'ai trouvé un logiciel qui peut peut-être vous aider. Il semble que quelqu'un ait eu le même problème que vous et ils lui ont donné une solution dans ce forum , vous devrez donc utiliser ArcGIS, mais si vous recherchez un algorithme, ils suggèrent ce document . Je pense que l'article est suffisamment détaillé pour être un bon début pour votre algorithme.

eyanquenb
la source
2
Parce que toutes les informations sont que cette réponse réside dans ses liens, et que les liens finissent par pourrir, veuillez au moins résumer ce que les messages du forum et le document recommandent.
whuber