Je comprends les couches convolutionnelles et de mise en commun, mais je ne vois pas la raison d'une couche entièrement connectée dans les CNN. Pourquoi la couche précédente n'est-elle pas directement connectée à la couche de sortie?
19
J'ai trouvé cette réponse d' Anil-Sharma sur Quora utile.
Nous pouvons diviser l'ensemble du réseau (pour la classification) en deux parties:
Extraction d' entités: Dans les algorithmes de classification conventionnels, comme les SVM, nous avions l'habitude d'extraire des entités des données pour faire fonctionner la classification. Les couches convolutives servent le même but d'extraction d'entités. Les CNN capturent une meilleure représentation des données et nous n'avons donc pas besoin de faire de l'ingénierie des fonctionnalités.
Classification : Après l'extraction des fonctionnalités, nous devons classer les données en différentes classes, cela peut être fait en utilisant un réseau neuronal entièrement connecté (FC). Au lieu de couches entièrement connectées, nous pouvons également utiliser un classificateur classique comme SVM. Mais nous finissons généralement par ajouter des couches FC pour rendre le modèle de bout en bout entraînable.
la source