Que sont les «VGG54» et «VGG22» dérivés du VGG19 CNN?

Dans l'article Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network de Christian Ledig et al., La distance entre les images (utilisée dans la fonction de perte) est calculée à partir de cartes de caractéristiques extraites du réseau VGG19. Les deux utilisés dans l'article sont (un peu confus) appelés VGG22 et VGG54.

Quelles sont ces cartes de fonctionnalités?

Que signifient les désignations "22" et "54"?

deep-learning cnn gan Lafayette
la source

19 est le nombre de couches. Le reste signifie probablement la même chose?

Alex

Si c'était aussi simple que ça ... ;-) Ce sont des désignations de mappage à partir du VGG19, pas des réseaux à part entière.

Lafayette

Je n'ai jamais lu le journal. C'est la première chose qui me vient à l'esprit lorsque je vois l'acronyme.

Alex

Votre hypothèse est en effet raisonnable, mais ils disent que ce n'est pas le cas, seul le réseau VGG19 est utilisé.

Lafayette

Réponses:

En lisant l'article, il semble qu'ils définissent VGG54 comme la perte calculée à partir de la distance euclidienne entre le $\phi_{5,4}$ des cartes fonctionnelles dérivées des images haute et basse résolution utilisant le réseau VGG19. Où $\phi_{i,j}$ est définie comme " la carte de caractéristiques obtenue par la j-ème convolution (après activation) et avant la i-ème couche de pooling maximum au sein du réseau VGG19 ".

Carlos S. Na
la source

Je suppose que la même chose est vraie pour VGG22 - c'est-à-dire que c'est la perte calculée à partir de ,22,2. Est-ce correct?

Lafayette

C'est vrai :)

Carlos S. Na

Pouvez-vous développer "la carte des fonctionnalités obtenue par la j-ème convolution (après activation) et avant la i-ème couche de pooling maximum au sein du réseau VGG19"?

ϕ_{5, 4}

$\phi_{5,4}$ veux dire

4^{t h}

$4^{th}$ couche avant

5^{t h}

$5^{th}$ couche max-pooling à droite? Mais

4^{t h}

$4^{th}$ couche a tellement de filtres (je pense que 512). Nous aurions donc 512 espaces fonctionnels. Lequel choisir? De plus, que signifie "après activation"?

Nagabhushan SN