Dans l'article Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network de Christian Ledig et al., La distance entre les images (utilisée dans la fonction de perte) est calculée à partir de cartes de caractéristiques extraites du réseau VGG19. Les deux utilisés dans l'article sont (un peu confus) appelés VGG22 et VGG54.
Quelles sont ces cartes de fonctionnalités?
Que signifient les désignations "22" et "54"?
deep-learning
cnn
gan
Lafayette
la source
la source
Réponses:
En lisant l'article, il semble qu'ils définissent VGG54 comme la perte calculée à partir de la distance euclidienne entre leϕ5 , 4 des cartes fonctionnelles dérivées des images haute et basse résolution utilisant le réseau VGG19. Oùϕi , j est définie comme " la carte de caractéristiques obtenue par la j-ème convolution (après activation) et avant la i-ème couche de pooling maximum au sein du réseau VGG19 ".
la source