Dans la théorie de l'échelle-espace, la représentation échelle-espace du signal , (dans le cas de l'image ) est donnée par: où est un noyau gaussien avec le paramètre et est une convolution. En modifiant le paramètre , nous recevons une image plus ou moins lissée. Comme résultat, une représentation plus grossière (paramètre ) ne contiendra pas de petits objets ni de bruit.
L'essentiel est de trouver un moyen de détection de caractéristiques invariantes à l'échelle, non? De sorte que pour une image à sa copie de taille réduite, les fonctionnalités telles que les points clés seront détectées correctement, même si la taille est différente, sans trouver d'autres points clés de bruit.
Dans l'article, ils utilisent les dérivés normalisés . . Quelle est la signification de l'utilisation du dérivé normalisé , en quoi cela aide-t-il dans l'invariance d'échelle?
Sur cette image, nous pouvons voir qu'à peu près aux mêmes positions, les différents points clés trouvés (de taille différente). Comment est-ce possible?
Si vous pouvez expliquer l'algorithme étape par étape de la détection de caractéristiques invariantes à l'échelle, ce serait formidable. Que fait-on réellement? Les dérivés peuvent être pris par ou . Blob peut être détecté en prenant la dérivée de par les variables . Comment le dérivé de aide- -il ici?
Le papier que je lisais est: Détection de fonction avec sélection automatique de l'échelle