Quelles sont les fonctionnalités des goulots d'étranglement?

11

Dans le billet de blog Construire des modèles de classification d'images puissants en utilisant très peu de données , les fonctionnalités de goulot d'étranglement sont mentionnées. Quelles sont les fonctionnalités des goulots d'étranglement? Changent-ils avec l'architecture utilisée? S'agit-il de la sortie finale des couches convolutives avant la couche entièrement connectée? Pourquoi sont-ils appelés ainsi?

Abhishek Bhatia
la source
[Voir aussi] ( ai.stackexchange.com/questions/4864/… )
Anurag Singh

Réponses:

9

Dans le billet de blog Construire des modèles de classification d'images puissants en utilisant très peu de données , les fonctionnalités de goulot d'étranglement sont mentionnées. Quelles sont les fonctionnalités des goulots d'étranglement?

C'est clairement écrit dans le lien que vous avez donné aux "fonctionnalités de goulot d'étranglement" du modèle VGG16: les dernières cartes d'activation avant les couches entièrement connectées .

Changent-ils avec l'architecture utilisée?

Sûr. L'auteur a probablement utilisé un modèle pré-formé (formé sur de grandes données et maintenant utilisé uniquement comme extracteur de fonctionnalités)

S'agit-il de la sortie finale des couches convolutives avant la couche entièrement connectée?

Oui.

Pourquoi sont-ils appelés ainsi?

Étant donné la taille d'entrée de VGG, les cartes de caractéristiques des dimensions HxW deviennent deux fois plus petites après chaque opération de pool max. HxW est la plus petite de la dernière couche convolutionnelle.

FunkyKowal
la source
6

Tout d'abord, nous devons parler de l'apprentissage par transfert. Imaginez que vous avez formé un réseau neuronal sur un ensemble de données d'images pour détecter les chats, vous pouvez utiliser une partie de la formation que vous avez faite pour travailler sur un autre détection d'autre chose. C'est ce qu'on appelle l'apprentissage par transfert.

Pour effectuer un transfert d'apprentissage, vous allez supprimer le dernier calque entièrement connecté du modèle et y brancher vos calques. La sortie du modèle "tronquée" va être les fonctionnalités qui rempliront votre "modèle". Ce sont les caractéristiques des goulots d'étranglement.

VGG16 est un modèle de pré-entraînement sur le catalogue ImageNet qui a une très bonne précision. Dans le message que vous avez partagé, utilise ce modèle comme base pour détecter les chats et les chiens avec une plus grande précision.

Les fonctionnalités des goulots d'étranglement dépendent du modèle. Dans ce cas, nous utilisons VGG16. Il existe d'autres modèles pré-formés comme VGG19, ResNet-50

C'est comme si vous coupiez un modèle et ajoutiez vos propres couches. Principalement, la couche de sortie pour décider de ce que vous voulez détecter, la sortie finale.

letyrodri
la source