Que sont les «VGG54» et «VGG22» dérivés du VGG19 CNN?

9

Dans l'article Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network de Christian Ledig et al., La distance entre les images (utilisée dans la fonction de perte) est calculée à partir de cartes de caractéristiques extraites du réseau VGG19. Les deux utilisés dans l'article sont (un peu confus) appelés VGG22 et VGG54.

Quelles sont ces cartes de fonctionnalités?

Que signifient les désignations "22" et "54"?

Lafayette
la source
19 est le nombre de couches. Le reste signifie probablement la même chose?
Alex
Si c'était aussi simple que ça ... ;-) Ce sont des désignations de mappage à partir du VGG19, pas des réseaux à part entière.
Lafayette
Je n'ai jamais lu le journal. C'est la première chose qui me vient à l'esprit lorsque je vois l'acronyme.
Alex
Votre hypothèse est en effet raisonnable, mais ils disent que ce n'est pas le cas, seul le réseau VGG19 est utilisé.
Lafayette

Réponses:

3

En lisant l'article, il semble qu'ils définissent VGG54 comme la perte calculée à partir de la distance euclidienne entre le ϕ5,4des cartes fonctionnelles dérivées des images haute et basse résolution utilisant le réseau VGG19. Oùϕje,jest définie comme " la carte de caractéristiques obtenue par la j-ème convolution (après activation) et avant la i-ème couche de pooling maximum au sein du réseau VGG19 ".

Carlos S. Na
la source
Je suppose que la même chose est vraie pour VGG22 - c'est-à-dire que c'est la perte calculée à partir de ,22,2. Est-ce correct?
Lafayette
1
C'est vrai :)
Carlos S. Na
1
Pouvez-vous développer "la carte des fonctionnalités obtenue par la j-ème convolution (après activation) et avant la i-ème couche de pooling maximum au sein du réseau VGG19"? ϕ5,4 veux dire 4th couche avant 5thcouche max-pooling à droite? Mais4thcouche a tellement de filtres (je pense que 512). Nous aurions donc 512 espaces fonctionnels. Lequel choisir? De plus, que signifie "après activation"?
Nagabhushan SN