Représentation vectorielle d'entrée vs représentation vectorielle de sortie dans word2vec

9

Dans les modèles CBOW et skip-gram de word2vec, comment le choix des vecteurs de mots de (matrice de mots d'entrée) par rapport au choix des vecteurs de mots de (matrice de mots de sortie) affecte-t-il la qualité des vecteurs de mots résultants?WW

CBOW:

entrez la description de l'image ici

Skip-gram:

entrez la description de l'image ici

Franck Dernoncourt
la source

Réponses:

8

Garten et al. {1} des vecteurs de mots comparés obtenus en ajoutant des vecteurs de mots d'entrée avec des vecteurs de mots de sortie, par rapport aux vecteurs de mots obtenus en concaténant des vecteurs de mots d'entrée avec des vecteurs de mots de sortie. Dans leurs expériences, la concaténation donne des résultats nettement meilleurs:

entrez la description de l'image ici

La conférence vidéo {2} recommande de faire la moyenne des vecteurs de mots d'entrée avec les vecteurs de mots de sortie, mais ne compare pas la concaténation des vecteurs de mots d'entrée avec les vecteurs de mots de sortie.


Références:

Franck Dernoncourt
la source