En termes de jargon de réseau de neurones (y = poids * x + biais), comment saurais-je quelles variables sont plus importantes que d'autres?
J'ai un réseau neuronal avec 10 entrées, 1 couche cachée avec 20 nœuds et 1 couche de sortie qui a 1 nœud. Je ne sais pas comment savoir quelles variables d'entrée ont plus d'influence que les autres variables. Ce que je pense, c'est que si une entrée est importante, elle aura une connexion très pondérée avec la première couche, mais le poids peut être positif ou négatif. Donc, ce que je pourrais faire, c'est prendre la valeur absolue des poids de l'entrée et les additionner. Les intrants les plus importants auraient des sommes plus élevées.
Ainsi, par exemple, si la longueur des cheveux est l'une des entrées, elle devrait avoir 1 connexion à chacun des nœuds de la couche suivante, donc 20 connexions (et donc 20 poids). Puis-je simplement prendre la valeur absolue de chaque poids et les additionner?
la source
Réponses:
Ce que vous décrivez est en effet une façon standard de quantifier l'importance des entrées du réseau neuronal. Notez que pour que cela fonctionne, cependant, les variables d'entrée doivent être normalisées d'une manière ou d'une autre. Sinon, les poids correspondant aux variables d'entrée qui ont tendance à avoir des valeurs plus élevées seront proportionnellement plus petits. Il existe différents schémas de normalisation, comme par exemple la soustraction de la moyenne d'une variable et la division par son écart-type. Si les variables n'étaient pas normalisées en premier lieu, vous pourriez effectuer une correction sur les poids eux-mêmes dans le calcul de l'importance, par exemple en multipliant par l'écart-type de la variable.
Ici est l'écart-type de la ème entrée, est l'importance de la ème entrée, est le poids reliant la ème entrée au ème nœud caché dans la première couche, et est le nombre de nœuds cachés dans la première couche. i I i i w i j i j n cachéσje je jeje je wje j je j ncaché
Une autre technique consiste à utiliser la dérivée de la cartographie du réseau neuronal par rapport à l'entrée en question, moyenne sur les entrées.
Ici est la ème entrée, est la sortie et la valeur d'attente est prise par rapport au vecteur d'entrées . i y xXje je y X
la source
Une solution un peu brutale mais efficace:
Essayez de «supprimer» une entrée en utilisant une constante pour l'une de vos fonctionnalités d'entrée. Ensuite, entraînez le réseau pour chacun des cas possibles et voyez comment votre précision diminue. Les entrées importantes fourniront le plus grand avantage à la précision globale.
la source
Ce que vous avez décrit n'est pas un "réseau profond", où vous n'avez que entrées et unités en couche cachée. Lorsque les gens parlent d'apprentissage en profondeur, cela signifie généralement des centaines de milliers d'unités cachées.5dix 5
Pour un réseau peu profond, cela donne un exemple de définition de l'importance variable.
Pour un réseau vraiment profond, les gens ne parlent pas trop d'importance variable. Parce que les entrées sont des fonctionnalités de niveau brut, telles que des pixels dans une image.
la source
Le plus que Ive a trouvé à ce sujet est minutieusement répertoriés sur ce site plus précisément vous pouvez regarder ce . Si vous ne parlez que de modèles linéaires, vous devez normaliser les poids pour les rendre interprétables, mais même cela peut être plus trompeur à ce sujet sur le lien mentionné. Certaines personnes ont essayé de faire des fonctions complexes de poids pour interpréter l'importance des entrées (Garson, Gedeon et Milne), mais même cela peut être trompeur, vous pouvez en savoir plus une fois que vous faites défiler le premier lien que j'ai mentionné. En général, je conseillerais d'aller de l'avant interpréter les résultats avec un grain de sel.
serait d'accord avec la réponse de @ rhadar mais voudrait ajouter qu'au lieu d'utiliser une constante, essayez d'utiliser la valeur moyenne pour cette entrée et n'oubliez pas de recycler le réseau.
PS: désolé, je n'ai pas pu poster plus de liens ou de commentaires ici n'ont pas beaucoup de réputation.
la source
Étant donné que vous avez:
Quelqu'un a-t-il essayé:
Dans ce cas, je pense que la sortie serait un nombre désignant l '"importance" de la fonction car cette sortie représenterait également la sortie du chemin de ce 1 signal à l'intérieur du réseau.
C'est comme allumer une seule ampoule à l'intérieur d'un labyrinthe et mesurer la lumière qui sort à la sortie.
la source