En lisant certains articles sur l'odométrie visuelle, beaucoup utilisent la profondeur inverse. Est-ce seulement l'inverse mathématique de la profondeur (signifiant 1 / d) ou représente-t-il autre chose. Et quels sont les avantages de l'utiliser?
slam
computer-vision
odometry
Mehdi
la source
la source
Le paramétrage de profondeur inverse représente la distance d'un point de repère, d, de la caméra exactement comme il est dit, proportionnelle à 1 / d dans l'algorithme d'estimation. Le raisonnement derrière l'approche est que les approches de filtrage telles que le filtre de Kalman étendu (EKF) supposent que l'erreur associée aux caractéristiques est gaussienne.
Dans un cadre d'odométrie visuelle, la profondeur d'un point de repère est estimée en suivant les caractéristiques associées sur certaines séries de trames, puis en utilisant la parallaxe induite. Cependant, pour les caractéristiques éloignées (par rapport au déplacement de la caméra), la parallaxe résultante sera petite et, surtout, la distribution d'erreur associée à la profondeur est fortement culminée près de la profondeur minimale avec une longue queue (c'est-à-dire qu'elle n'est pas bien modélisée via un Distribution gaussienne). Pour voir un exemple, veuillez vous référer à la figure 7 de l'article de Civera et al. (Mentionné par @freakpatrol), ou à la figure 4 de Fallon et al. ICRA 2012 .
En représentant la profondeur inverse (ie 1 / d) cette erreur devient gaussienne. De plus, il permet de représenter des points très éloignés, par exemple des points à l'infini.
L'aspect important de la représentation utilisée est le papier de Civera est expliqué dans la section II B de son papier (voir l'équation (3)). Ici, un point de repère est représenté par rapport à la pose (position et orientation) de la première caméra à partir de laquelle il est vu. Cette pose est capturée dans les cinq premiers paramètres de l'équation (3), tandis que le sixième paramètre, , représente la profondeur inverse. L'équation (4) fournit une expression pour récupérer la position mondiale du point (c'est-à-dire celle où la profondeur inverse est convertie en profondeur comme )ρje 1 / ρje
la source
L'article de Davison présentant la méthode est assez facile à comprendre:
Paramétrage de la profondeur inverse pour SLAM monoculaire par Javier Civera, Andrew J. Davison et JM Martınez Montiel DOI: 10.1109 / TRO.2008.2003276
la source
En plus des raisons mentionnées dans d'autres réponses sur le conditionnement numérique de la profondeur inverse, une raison majeure pour que ce terme apparaisse dans la littérature d'odométrie spécifiquement visuelle est dans la façon dont les profondeurs sont calculées à partir de la vision stéréo: après rectification, les informations 3D sont déduites de la distance en X entre l'endroit où un point apparaît dans les images des deux caméras.
la source