J'essaie de concevoir une technique de factorisation matricielle pour un élément utilisateur simple, un système de recommandation de notes. J'ai 2 questions à ce sujet.
Tout d'abord dans une implémentation simple que j'ai vue de la technique de factorisation matricielle pour la recommandation de film, l'auteur vient d'initialiser les dimensions des fonctionnalités latentes appelons-le K des deux matrices utilisateur et élément de fonctionnalité latente, à une constante K disons 2 et donc chacune ses matrices de caractéristiques latentes P et Q étaient NXK et MXK où R est la matrice de notation des éléments utilisateur d'origine que nous essayons d'approximer avec les dimensions NXM (N utilisateurs et M éléments). Ma question est donc de savoir comment déterminer le «K» optimal (nombre de fonctionnalités latentes) dans ce cas au lieu de simplement le définir sur une constante?
Existe-t-il également un moyen d'incorporer les informations sur l'utilisateur ou l'article que j'ai déjà dans mon ensemble de données, telles que la note moyenne d'un utilisateur particulier, le sexe de l'utilisateur, l'emplacement_utilisateur, etc. dans ce résultat de la factorisation de la matrice tout en faisant ma recommandation finale (je suppose peut-être qu'un modèle de fusion avec les informations sur l'utilisateur et l'élément représenté dans un autre modèle de filtrage basé sur le contenu avec mon modèle de factorisation matricielle fonctionnerait?).
1> Ma première question est de savoir comment déterminer le nombre optimal de caractéristiques latentes K 2> quelqu'un connaît-il la littérature récente qui implémente un modèle de mélange de factorisation matricielle et de filtrage basé sur le contenu (parce que je suppose que ce serait la seule façon de représenter les informations démographiques d'utilisateurs et d'éléments dans un espace de fonctionnalité commun.)