Disons que la tâche consiste à déterminer la position de l'élément sur l'image. La première chose très importante est la détection correcte de l'objet, puis certains algorithmes de calcul de la position sont utilisés (pour l'analyse des blobs). Tout dépend de plusieurs choses (exactitude de la détection, algorithmes utilisés, etc.)
Supposons que nous ayons une image callibrée et connaissons l'erreur donnée par la callibration. Quelles sont les méthodes pour calculer de manière fiable la précision des algorithmes de vision par ordinateur (et machine)? Peut-on le faire de manière analytique ou uniquement par des expériences et des tests?
La question s'adresse aux cas où nous détectons la position des éléments et également d'autres problèmes de vision par ordinateur.
Je veux obtenir des références aux problèmes liés à la vision par ordinateur / machine, en particulier la détection de position des éléments, et présenter des calculs de correction, soit analytiques, soit expérimentaux, pour montrer cette précision.
Les suggestions pour améliorer cette question sont également les bienvenues.
Cela ne répond pas à toute la question, mais cela répond en partie à ce que le PO demande.
Cela ne peut être fait qu'expérimentalement. Pour le faire analytiquement, il faudrait des informations sur ce que l'algorithme aurait dû retourner. Mais pour le savoir, vous avez besoin d'un algorithme de vision par ordinateur connu et toujours correct pour comparer (ainsi que des descriptions analytiques détaillées de l'image testée). Les solutions analytiques nécessitent la connaissance d'une vérité fondamentale qui est analytique plutôt que générée manuellement au cas par cas. Mais nous n'avons pas de méthode analytique pour générer une vérité fondamentale - c'est ce que nous essayons de développer.
Étant donné que cela ne peut être fait qu'à titre expérimental, vous voudrez peut-être regarder google scholar. Si vous recherchez la localisation de personnes, de nombreux documents seront consacrés à la localisation d'une personne ou de parties d'une personne comme une tête ou des mains. L'emplacement des voitures fera également l'objet d'une attention particulière. D'autres objets voudront simplement des algorithmes génériques.
la source