Mesurer la taille d'un objet à l'aide d'un réseau neuronal profond

10

J'ai un grand ensemble de données de véhicules avec la vérité au sol de leurs longueurs (plus de 100 000 échantillons). Est-il possible de former un réseau profond pour mesurer / estimer la longueur du véhicule? Je n'ai vu aucun article concernant l'estimation de la taille d'un objet à l'aide d'un réseau neuronal profond.

Naji
la source
1
Très bonne question. Bienvenue chez AI!
DukeZhou
(Note au modérateur) - il s'agit d'une réponse d'espace réservé pour poser une question à OP car je ne peux pas commenter. Votre jeu de données est-il des images ou du texte? hisairnessag3 est sur la bonne voie avec le portage de l'approche pixels / métrique d'OpenCV vers une détection d'objets DNN
Adnan S

Réponses:

4

Oui! Cela peut très certainement être fait. Étant donné que vous avez un ensemble de données étiqueté, cela le rend encore plus simple!

Je voudrais jeter un oeil à ce projet et cela devrait vous amener là où vous devez aller.

Les détails de mise en œuvre devraient être assez simples. Faites-moi savoir si je peux vous aider davantage.

hisairnessag3
la source
1
Il n'est pas nécessaire d'expliquer pourquoi quelqu'un vote contre. De nombreux programmeurs n'ont pas assez de temps pour regarder les commentaires, ils regardent les votes pour voir si la réponse en vaut la peine ou non. Si vous relisez la question, vous constaterez que la question concerne spécifiquement l'utilisation de DNN et rien d'autre. le projet que vous avez partagé concerne l'utilisation d'Opencv ... si vous lisez les commentaires sous le message que vous avez partagé, vous constaterez que les gens posent des questions sur DNN, mais le message lui-même n'utilise pas DNN. Soit dit en passant, je ne suis pas la personne qui a voté contre votre réponse
BH85
2
Ce n'est pas nécessaire mais utile. Si vous effectuez une recherche approfondie, vous ne trouverez aucun projet ni document sur ce cas d'utilisation particulier pour les DNN. Cela étant dit, j'ai fait référence au projet le plus proche possible dans l'espoir de lancer OP. De plus, j'ai répondu à la question. La question était de savoir si cela pouvait être fait.
hisairnessag3
Merci pour votre réponse! Je pense que ce serait amélioré par une petite explication de comment / pourquoi c'est possible. Au moins un aperçu de l'architecture serait très utile.
Ben N
1

Oui, c'est possible, mais vous devez d'abord reconnaître un objet dans l'image, soit 1) le véhicule lui-même, puis signaler la taille connue de ce véhicule, ou 2) un objet connu qui est à la même distance de l'appareil photo que la voiture ( un trottoir, un panneau d'arrêt, la tête du conducteur, un poney shetland ... peu importe), puis utiliser cet objet pour calibrer la taille de la voiture qui en est très proche.

Toute voiture dans une image sera à une distance inconnue de l'appareil photo, ce qui rendra l'objet de voiture plus grand ou plus petit d'une photo à l'autre. Si vous ne reconnaissez pas la voiture ou au moins un objet référent qui a une taille connue, la taille physique de la voiture ne sera pas calibrée - vous n'aurez aucune base pour votre estimation de taille.

Si la voiture est inconnue, même si vous avez des indices visuels (il y a un objet référent ou la distance de la caméra à la voiture est connue), l'étendue inconnue du grand angle de l'objectif de la caméra peut déformer la forme d'une voiture inconnue (hauteur vs largeur), compliquant davantage votre capacité à estimer ses dimensions apparentes.

Excité
la source
La plaque d'immatriculation du véhicule peut-elle être cet objet connu utilisé pour calibrer la taille de la voiture? Les plaques d'immatriculation sont généralement de la même taille.
Naji
1
Vous devez faire attention aux hypothèses que vous faites selon lesquelles les plaques d'immatriculation sont de la même taille. Par exemple, une plaque australienne et une plaque américaine sont de tailles différentes. Si ce n'est pas un problème pour votre application (elle ne fonctionnera que dans un seul pays), vous pouvez supposer une taille de référence pour la plaque. Il faudra quand même être prudent, car la plaque peut ne pas être orientée normalement vers vous. Si la voiture est à 45 degrés, la largeur de la plaque prendra moins de pixels qu'à 0, même à la même distance.
pshlady
1

Je pense que ce document peut vous aider: Estimation du cadre de délimitation 3D à l'aide de l'apprentissage en profondeur et de la géométrie

Il a utilisé 1 VGG-19 (pré-formé sur ImageNet) pour apprendre la taille des voitures

cryax dsa
la source
Comme vous, j'ai supposé qu'il s'agissait d'inférer un cadre de délimitation 3D où les données sont représentées dans une image 2D. Le projet mentionné par hisairnessag3 ne semble concerner que le cadre de délimitation 2D sans comportement inférentiel appris sur la nature 3D que l'image pourrait contenir.
Jim
Cet article estime la taille et l'orientation de la voiture à l'aide d'une image recadrée 2D (ne contient que l'objet souhaité).
cryax dsa