L'un des aspects les plus importants d'une base de données équipée d'un SIG est qu'elle permet à l'utilisateur de rechercher rapidement tous les points d'une zone géographique arbitraire qui correspondent à certains critères supplémentaires. (Par exemple, "Trouvez-moi les 3 restaurants les plus proches de ce point sur une carte.")
Quelqu'un peut-il m'indiquer une discussion théorique des algorithmes impliqués? Je veux savoir comment ils fonctionnent.
En fin de compte, je veux appliquer la même capacité à des ensembles généralisés de données numériques - un grand nuage de points dans un espace arbitraire, à n dimensions, non euclidien. Par exemple, le visage d'une personne peut être caractérisé comme un vecteur de nombres: [distance entre les yeux, distance entre les yeux et la bouche, largeur du visage, longueur du visage, etc.]. Je veux filmer le trafic sur les trottoirs, estimer les caractéristiques du visage de chaque personne, puis être en mesure d'interroger les données plus tard, telles que "étant donné le visage de cette personne, trouvez-moi les 100 visages les plus similaires".
Existe-t-il actuellement un logiciel existant qui permet de rechercher dans ces espaces généralisés?
J'ai entendu dire que Netezza a implémenté des algorithmes innovants de traitement parallèle spatial . Le livre blanc est ici .
Mise à jour
J'ai oublié de mentionner que Netezza s'appuie fortement sur le théorème de Bayes . Voici une collection de vidéos ici .
la source