Que transmet le nombre de filtres dans une couche de convolution?
Comment ce nombre affecte-t-il les performances ou la qualité de l'architecture? Je veux dire, devrions-nous toujours opter pour un plus grand nombre de filtres? qu'est-ce qu'ils ont de bon? et comment les gens attribuent-ils un nombre différent de filtres pour différentes couches? Je veux dire en regardant cette question: Comment déterminer le nombre d'opérateurs convolutifs dans CNN?
La réponse spécifiait 3 couches de convolution avec différents nombres de filtres et de taille, encore une fois dans cette question: nombre de cartes de caractéristiques dans les réseaux de neurones convolutifs
vous pouvez voir sur l'image que nous avons 28 * 28 * 6 filtres pour la première couche et 10 * 10 * 16 filtre pour la deuxième couche conv. Comment parviennent-ils à ces chiffres, est-ce par essais et erreurs? Merci d'avance
16
Réponses:
Que transmet le nombre de filtres dans une couche de convolution? - J'aime généralement voir les filtres comme des détecteurs de fonctionnalités. Bien que cela dépende du domaine problématique, la signification # des détecteurs d'entités est intuitivement le nombre d'entités (comme les arêtes, les lignes, les parties d'objet, etc.) que le réseau peut potentiellement apprendre. Notez également que chaque filtre génère une carte d'entités. Les cartes de fonctionnalités vous permettent d'apprendre les facteurs explicatifs de l'image, donc plus de filtres signifie plus le réseau apprend (pas nécessairement bon tout le temps - la saturation et la convergence importent le plus)
Comment ce nombre affecte-t-il les performances ou la qualité de l'architecture? - Je ne pense pas que vous trouverez une bonne réponse pour ce type de question car nous essayons toujours de formaliser ce qui se passe à l'intérieur de la boîte noire DL. Intuitivement, vous apprendrez à nouveau une fonction non linéaire plus robuste, plus vous aurez de banques de filtres, mais les performances dépendront du type de tâche et des caractéristiques des données. Vous voulez généralement savoir quel type de données vous traitez pour déterminer les paramètres # dans votre architecture (y compris le filtre). De combien de filtres ai-je besoin? revient plus à demander à quel point (spécialement) les images de mon jeu de données sont complexes. Il n'y a aucune notion formelle qui relie les filtres # aux performances. C'est tout expérimental et itératif. Beaucoup de traces et d'erreurs.
la source