Ces types de questions peuvent dépendre du problème, mais j'ai essayé de trouver des recherches qui répondent à la question de savoir si le nombre de couches cachées et leur taille (nombre de neurones dans chaque couche) importent vraiment ou non.
Donc ma question est, est-ce vraiment important si nous avons par exemple 1 grande couche cachée de 1000 neurones contre 10 couches cachées avec 100 neurones chacune?
la source
Il y a tellement d'aspects.
1. Formation: La formation des filets profonds est un travail difficile en raison du problème de gradient de fuite (explosion arrière). La construction d'un réseau neuronal 10x100 n'est donc pas recommandée.
2. Performance du réseau formé:
Les filets plus profonds sont donc plus "intelligents" mais la structure de filet 10x100 est un bon choix.
la source
Si le problème que vous résolvez est séparable linéairement, une couche de 1000 neurones peut faire mieux que 10 couches avec chacun de 100 neurones. Si le problème est non linéaire et non convexe, alors vous avez besoin de réseaux neuronaux profonds.
la source
La sortie de la première couche cachée sera multipliée par un poids, traitée par une fonction d'activation dans la couche suivante et ainsi de suite. Les réseaux neuronaux à une seule couche sont très limités pour les tâches simples, un NN plus profond peut fonctionner bien mieux qu'une couche unique.
Cependant, n'utilisez pas plus de couche si votre application n'est pas assez complexe. En conclusion, une couche de 100 neurones ne signifie pas un meilleur réseau neuronal que 10 couches x 10 neurones, mais 10 couches sont quelque chose d'imaginaire, sauf si vous faites un apprentissage en profondeur. commencez avec 10 neurones dans la couche cachée et essayez d'ajouter des couches ou ajoutez plus de neurones à la même couche pour voir la différence. l'apprentissage avec plus de couches sera plus facile mais plus de temps de formation est nécessaire.
la source