1) C1 dans la couche 1 a 6 cartes de caractéristiques, cela signifie-t-il qu'il y a six noyaux convolutifs? Chaque noyau convolutionnel est utilisé pour générer une carte d'entités basée sur l'entrée.
Il y a 6 noyaux convolutionnels et chacun est utilisé pour générer une carte d'entités basée sur l'entrée. Une autre façon de le dire est qu'il existe 6 filtres ou ensembles de poids 3D que j'appellerai juste des poids. Ce que cette image ne montre pas, ce qu'elle devrait probablement, pour être plus clair, c'est que les images ont généralement 3 canaux, par exemple rouge, vert et bleu. Ainsi, les poids qui vous mappent de l'entrée à C1 sont de forme / dimension 3x5x5 et pas seulement 5x5. Les mêmes poids tridimensionnels, ou noyau, sont appliqués sur l'ensemble de l'image 3x32x32 pour générer une carte d'entités bidimensionnelle dans C1. Il y a 6 noyaux (chacun 3x5x5) dans cet exemple, ce qui fait 6 mappes d'entités (chaque 28x28 puisque la foulée est 1 et le remplissage est nul) dans cet exemple, chacune étant le résultat de l'application d'un noyau 3x5x5 sur l'entrée.
2) S1 dans la couche 1 a 6 cartes d'entités, C2 dans la couche 2 a 16 cartes d'entités. À quoi ressemble le processus pour obtenir ces 16 cartes d'entités basées sur 6 cartes d'entités dans S1?
Faites maintenant la même chose que nous avons fait dans la couche un, mais faites-le pour la couche 2, sauf que cette fois le nombre de canaux n'est pas 3 (RVB) mais 6, six pour le nombre de cartes / filtres d'entités dans S1. Il existe désormais 16 noyaux uniques de forme / dimension 6x5x5 chacun. chaque noyau de la couche 2 est appliqué sur l'ensemble de S1 pour générer une carte d'entités 2D dans C2. Cela se fait 16 fois pour chaque noyau unique de la couche 2, tous les 16, pour générer les 16 cartes d'entités dans la couche 2 (chaque 10 x 10 car la foulée est 1 et le remplissage est nul)
source: http://cs231n.github.io/convolutional-networks/