Tous les exemples que j'ai trouvés en utilisant des réseaux de neurones de croyance profonde ou convolutionnels les utilisent pour la classification d'images, la détection de chatacter ou la reconnaissance vocale.
Les réseaux de neurones profonds sont-ils également utiles pour les tâches de régression classiques, où les caractéristiques ne sont pas structurées (par exemple, ne sont pas organisées dans une séquence ou une grille)? Si oui, pouvez-vous donner un exemple?
Réponses:
Les caractéristiques des images qui les rendent susceptibles d'être classées avec un réseau neuronal profond sont qu'il existe une tonne de fonctionnalités (peut-être des millions, voire des milliards de pixels avec RVB, intensité, etc.) et si vous avez des étiquettes précises, ce ne sont pas des données bruyantes. Les caméras de nos jours sont très bonnes et elles ne mesurent rien. Grâce à Internet, nous avons maintenant beaucoup d'images étiquetées avec précision. Un réseau profond peut exprimer des fonctions arbitrairement compliquées, ce qui est un problème avec les données bruyantes car vous pouvez très facilement surcharger le bruit, d'où la raison pour laquelle de nombreuses méthodes d'apprentissage ont tendance à pénaliser les modèles compliqués. Dans le cas de la reconnaissance d'image, cependant, la vraie fonction semble être très compliquée, nous n'avons aucune idée de ce à quoi ressemble la forme fonctionnelle et nous ne savons même pas quelles sont les caractéristiques pertinentes dans de nombreux cas.
Cela ne signifie pas que vous ne pouvez pas utiliser des réseaux profonds pour apprendre des fonctions n'ayant rien à voir avec les images. Vous devez juste être très prudent sur les inconvénients, surtout qu'il est très sujet au sur-ajustement, mais aussi qu'il est coûteux en calcul et peut prendre beaucoup de temps à s'entraîner (ce qui n'est pas autant un problème de nos jours avec les SGD et GPU parallélisés). L'autre inconvénient est que vous avez très peu ou pas d'interprétabilité du modèle, ce qui n'a pas vraiment d'importance pour la classification des images. Nous essayons juste de faire en sorte que les ordinateurs reconnaissent la différence entre un chimpanzé et un orang-outan. La compréhension humaine de la formule n'a pas d'importance. Pour d'autres domaines, en particulier le diagnostic médical, la recherche sur les politiques, etc., vous voulez ou pourriez même avoir besoin d'une compréhension humaine.
la source
Bien sûr, vous pouvez utiliser des réseaux de neurones profonds pour de nombreux problèmes en dehors de la reconnaissance d'image ou de la parole. Le problème est que si vous en avez vraiment besoin.
Les réseaux de neurones profonds sont beaucoup plus puissants qu'un simple MLP, mais ils prennent également plus de ressources et sont plus difficiles à développer. Ils sont donc utilisés dans des domaines vraiment complexes. Vous pouvez les utiliser pour résoudre des problèmes plus faciles, mais des modèles généralement plus simples obtiennent également de bons résultats.
Utiliser des réseaux de neurones profonds pour des problèmes faciles sera comme tuer des mouches avec un bazooka, bien sûr vous les tuerez mais ne pourriez-vous pas trouver un moyen plus simple?
la source
Je suis d'accord avec la réponse de davidivad. Mais je pense aussi que l'application des réseaux de neurones profonds aux images est que les images (et, plus important encore, les images étiquetées ) sont relativement peu coûteuses à collecter. Dans d'autres domaines, il peut être très coûteux de collecter des données à grande échelle, en particulier dans les limites d'une entreprise industrielle ou gouvernementale typique. Ce problème est aggravé par le fait que dans de nombreuses applications, le phénomène d'intérêt est relativement rare, de sorte qu'il y aura quelques exemples précieux à apprendre, de sorte que même un effort de collecte de données à relativement grande échelle pourrait produire un petit nombre de membres d'une classe.
la source