Interprétation des valeurs propres de la Hesse inverse dans un tracker KLT

12

Je suis étudiante en master, préparant un séminaire en vision par ordinateur. Parmi les sujets est le tracker Kanade-Lucas-Tomasi (KLT), comme décrit dans

J. Shi, C. Tomasi, "Bonnes fonctionnalités à suivre" . Procédure CVPR '94.

Voici une ressource Web que j'utilise pour comprendre le tracker KLT. J'ai besoin d'aide avec les mathématiques, car je suis un peu rouillé en algèbre linéaire et je n'ai aucune expérience préalable en vision par ordinateur.

Dans cette formule pour Δp (étape 5 du résumé), notez l'inverse de la Hesse:

Δp=H1Σx[IWp]T[T(x)I(W(x;p))]

Dans l'article, les bonnes caractéristiques à suivre sont définies comme celles où la somme des matrices de Hesse inverses ont de grandes valeurs propres similaires: min(λ1,λ2)>threshold . Je n'ai pas pu comprendre comment et d'où cela dérive, mathématiquement.

L'intuition est que cela représente un coin; Je comprends ça. Qu'est-ce que cela a à voir avec les valeurs propres? Je m'attends à ce que si les valeurs de la Hesse sont basses, il n'y a pas de changement et ce n'est pas un coin. S'ils sont hauts, c'est un coin. Quelqu'un sait-il comment l'intuition de la corneness entre en jeu dans les valeurs propres de la Hesse inverse afin de déterminer Δp travers les itérations du tracker KLT?

J'ai pu trouver des ressources affirmant que la Hesse inverse est corrélée à la matrice de covariance d'image. De plus, la covariance d'image indique le changement d'intensité, et alors cela a du sens ... mais je n'ai pas pu trouver exactement ce qu'est une matrice de covariance d'image par rapport à une image, et non pas un vecteur, ou une collection d'images.

En outre, les valeurs propres ont un sens dans l'analyse des composants de principe, c'est pourquoi j'ai l'idée d'une matrice de covariance d'image, mais je ne sais pas comment l'appliquer à la Hesse, car elle est généralement appliquée à une image. La Hesse, pour autant que je sache, est une matrice définissant les dérivées 2e pour , et à un certain endroit .2×2xyxy(x,y)

J'apprécierais vraiment de l'aide à ce sujet, car j'y suis depuis plus de 3 jours, ce n'est qu'une petite formule et le temps est compté.

Lorem Ipsum
la source
ok, je l'ai à peu près obtenu grâce à un tas de ressources Web concernant la courbure principale, la géomatrie différentielle, le numéro de condition de la matrice (matrice bien conditionnée). j'ai encore besoin de formuler une explication raisonnable pour le séminaire. une fois que je l'aurai, je le publierai ici ou lierai cette page au séminaire.

Réponses:

5

Considérez-les comme des termes de régularité 2D.
Plus le patch est lisse, plus le rang de la matrice est bas et plus la matrice est proche d'être singulière.

Sur un bord droit (pas un coin), une seule valeur propre sera grande.
Dans un coin, les deux seront grands.

L'utilisation de valeurs propres signifie que l' angle du bord n'est pas un facteur, et à n'importe quel angle, un bord ne donnera qu'un seul grand ev

Adi Shavit
la source
Merci pour votre réponse. j'ai trouvé de nombreuses ressources donnant des intuitions similaires et discutant du problème de l'ouverture. l'intuition est et était claire. ma question était de nature plus mathématique, et une fois que j'ai trouvé la réponse, il s'avère que c'était beaucoup plus simple. juste des propriétés de matrice de base. des valeurs propres similaires signifient que la matrice est bien conditionnée et que la valeur propre maximale est limitée, donc donner une limite inférieure rend les valeurs propres similaires. de plus, les valeurs propres sont corrélées aux courbures principales, pour la toile de jute. c'est l'information que je recherchais à l'époque.
je relis votre réponse, et je trouve le commentaire concernant les valeurs propres et l'angle perspicace. merci de partager cela avec moi.
Vous devez alors le marquer comme "Répondu".
Adi Shavit