J'ai une question concernant la reconnaissance d'objets, en particulier la reconnaissance des modèles de voitures! Je suis au début d'un travail sur l'identification du même modèle de voiture dans différentes images. Pour le moment, je pense que l'un des meilleurs algorithmes pour la reconnaissance d'objets 3D est SIFT, mais après avoir joué un peu avec une implémentation de démonstration, j'ai l'impression étrange que cet algorithme ait quelques problèmes avec des objets métalliques brillants comme les voitures, surtout s'ils ont des couleurs différentes.
Quelqu'un connaît-il des travaux sur ce domaine en général, un algorithme approprié pour la tâche de trouver le même modèle de voiture dans différentes images?
Merci d'avance pour votre aide!
Réponses:
J'examinerais l'approche dite du «sac de mots» ou des «mots visuels». Il est de plus en plus utilisé pour la catégorisation et l'identification des images. Cet algorithme commence généralement par détecter des points robustes, tels que des points SIFT, dans une image. La région autour de ces points trouvés (le descripteur SIFT 128 bits dans votre cas) est utilisée.
Dans la forme la plus simple, on peut collecter toutes les données de tous les descripteurs de toutes les images et les regrouper, par exemple en utilisant k-means. Chaque image originale a alors des descripteurs qui contribuent à un certain nombre de clusters. Les centroïdes de ces grappes, c'est-à-dire les mots visuels, peuvent être utilisés comme nouveau descripteur de l'image. Fondamentalement, vous espérez que les clusters d'une image auxquels ses descripteurs contribuent, sont indicatifs de la catégorie d'image.
Encore une fois, dans le cas le plus simple, vous avez une liste de clusters, et par image, vous comptez lequel de ces clusters contenait des descripteurs de cette image et combien. Ceci est similaire à la méthode terme fréquence / fréquence de document inverse (TD / IFD) utilisée dans la récupération de texte. Voir ce script Matlab rapide et sale .
Cette approche est activement recherchée et il existe de nombreux algorithmes beaucoup plus avancés.
Le site Web VLfeat contient une belle démonstration plus avancée de cette approche, classant l'ensemble de données caltech 101. Les résultats et les logiciels de Caltech lui-même sont également à noter .
la source