Réseaux de neurones profonds - Juste pour la classification des images?

14

Tous les exemples que j'ai trouvés en utilisant des réseaux de neurones de croyance profonde ou convolutionnels les utilisent pour la classification d'images, la détection de chatacter ou la reconnaissance vocale.

Les réseaux de neurones profonds sont-ils également utiles pour les tâches de régression classiques, où les caractéristiques ne sont pas structurées (par exemple, ne sont pas organisées dans une séquence ou une grille)? Si oui, pouvez-vous donner un exemple?

julien
la source
3
Votre première phrase fait apparaître des réseaux de neurones convolutifs. Il semble que vous les confondiez avec des réseaux de croyances profondes. Ce ne sont pas les mêmes, bien que les deux soient des formes de réseaux de neurones.
MSalters
1
Je serais d'accord avec @msalters, mais je dirais que les réseaux de croyances profondes sont vraiment des réseaux profonds et ont eu un succès limité, alors que les réseaux convolutionnels ressemblent plus à des filtres d'images adaptatifs hybrides s dans des couches convolutionnelles suivies de nn peu profonds.
seanv507
Qu'entendez-vous par «observations» n'étant pas «structurées (non organisées dans une séquence ou une grille)»? Faites-vous référence à des images «structurées» dans le sens où des pixels individuels sont disposés sur une grille? Mais alors ce sont des caractéristiques qui sont "structurées", pas des "observations" (ce seraient des images individuelles)?
amibe dit Réintégrer Monica
Je dirais que tous les réseaux de convolution sont profonds, tous les réseaux profonds ne sont pas la convolution, et de même tous les réseaux de croyances profondes sont profonds, tous les réseaux profonds ne sont pas des réseaux de croyances profondes. En effet, vous pouvez avoir des réseaux profonds qui ne sont ni profonds ni convolutifs, ils ont juste tendance à être difficiles à former. Il y a certes matière à débat inutile sur la terminologie.
Lyndon White
Vous ne pouvez pas appliquer un réseau convolutionnel à des données non structurées (pas en séquence / grille, etc.). Cela n'a pas de sens. Un réseau convolutionnel est étroitement lié à la prise de la transformée de Fourier de votre entrée - par exemple pour les séquences la convertissant du domaine temporel au domaine fréquentiel.
Lyndon White

Réponses:

8

Les caractéristiques des images qui les rendent susceptibles d'être classées avec un réseau neuronal profond sont qu'il existe une tonne de fonctionnalités (peut-être des millions, voire des milliards de pixels avec RVB, intensité, etc.) et si vous avez des étiquettes précises, ce ne sont pas des données bruyantes. Les caméras de nos jours sont très bonnes et elles ne mesurent rien. Grâce à Internet, nous avons maintenant beaucoup d'images étiquetées avec précision. Un réseau profond peut exprimer des fonctions arbitrairement compliquées, ce qui est un problème avec les données bruyantes car vous pouvez très facilement surcharger le bruit, d'où la raison pour laquelle de nombreuses méthodes d'apprentissage ont tendance à pénaliser les modèles compliqués. Dans le cas de la reconnaissance d'image, cependant, la vraie fonction semble être très compliquée, nous n'avons aucune idée de ce à quoi ressemble la forme fonctionnelle et nous ne savons même pas quelles sont les caractéristiques pertinentes dans de nombreux cas.

Cela ne signifie pas que vous ne pouvez pas utiliser des réseaux profonds pour apprendre des fonctions n'ayant rien à voir avec les images. Vous devez juste être très prudent sur les inconvénients, surtout qu'il est très sujet au sur-ajustement, mais aussi qu'il est coûteux en calcul et peut prendre beaucoup de temps à s'entraîner (ce qui n'est pas autant un problème de nos jours avec les SGD et GPU parallélisés). L'autre inconvénient est que vous avez très peu ou pas d'interprétabilité du modèle, ce qui n'a pas vraiment d'importance pour la classification des images. Nous essayons juste de faire en sorte que les ordinateurs reconnaissent la différence entre un chimpanzé et un orang-outan. La compréhension humaine de la formule n'a pas d'importance. Pour d'autres domaines, en particulier le diagnostic médical, la recherche sur les politiques, etc., vous voulez ou pourriez même avoir besoin d'une compréhension humaine.

Adam Acosta
la source
5

Bien sûr, vous pouvez utiliser des réseaux de neurones profonds pour de nombreux problèmes en dehors de la reconnaissance d'image ou de la parole. Le problème est que si vous en avez vraiment besoin.

Les réseaux de neurones profonds sont beaucoup plus puissants qu'un simple MLP, mais ils prennent également plus de ressources et sont plus difficiles à développer. Ils sont donc utilisés dans des domaines vraiment complexes. Vous pouvez les utiliser pour résoudre des problèmes plus faciles, mais des modèles généralement plus simples obtiennent également de bons résultats.

Utiliser des réseaux de neurones profonds pour des problèmes faciles sera comme tuer des mouches avec un bazooka, bien sûr vous les tuerez mais ne pourriez-vous pas trouver un moyen plus simple?

davidivad
la source
2
Ceci est une non réponse. Qu'est-ce qui est facile qu'est-ce qui est difficile? Prédire le marché boursier / extrapoler à partir d'exemples limités / ... IL Y A BEAUCOUP DE PROBLÈMES DIFFICILES.
seanv507
Je n'ai pas dit que les réseaux de neurones profonds pouvaient tout résoudre. Ce que je voulais dire, c'est qu'ils sont utilisés dans des domaines complexes où vous avez un grand nombre d'entrées. Je sais qu'ils ne peuvent pas résoudre tous les problèmes, mais ce n'est pas le but de cette question. Le fait est de souligner qu'ils pourraient être appliqués à d'autres problèmes en dehors de la reconnaissance d'image / parole, mais ils ont des inconvénients à considérer dans les cas où d'autres modèles pourraient être appliqués.
davidivad
5

Je suis d'accord avec la réponse de davidivad. Mais je pense aussi que l'application des réseaux de neurones profonds aux images est que les images (et, plus important encore, les images étiquetées ) sont relativement peu coûteuses à collecter. Dans d'autres domaines, il peut être très coûteux de collecter des données à grande échelle, en particulier dans les limites d'une entreprise industrielle ou gouvernementale typique. Ce problème est aggravé par le fait que dans de nombreuses applications, le phénomène d'intérêt est relativement rare, de sorte qu'il y aura quelques exemples précieux à apprendre, de sorte que même un effort de collecte de données à relativement grande échelle pourrait produire un petit nombre de membres d'une classe.

Sycorax dit de réintégrer Monica
la source