Signification des caractéristiques latentes?

15

J'essaie de comprendre les modèles de factorisation matricielle pour les systèmes recommandés et je lis toujours les «fonctionnalités latentes», mais qu'est-ce que cela signifie? Je sais ce que signifie une fonctionnalité pour un ensemble de données de formation, mais je ne parviens pas à comprendre l'idée des fonctionnalités latentes. Chaque article sur le sujet que je peux trouver est trop superficiel.

Éditer:

si vous pouvez au moins m'indiquer quelques articles qui expliquent l'idée.

machine-learning data-mining recommender-system Jack Twain
la source

Voici un exemple simple qui pourrait vous aider quuxlabs.com/blog/2010/09/…

Akavall

9

Latent signifie non directement observable. L'utilisation courante du terme dans l'ACP et l'analyse factorielle est de réduire la dimension d'un grand nombre de caractéristiques directement observables en un plus petit ensemble de caractéristiques indirectement observables.

samthebest
la source

donc les dimensions réduites sont alors les caractéristiques latentes? Dans le cas de l'ACP, les vecteurs propres de la matrice de covariance, c'est-à-dire les principales composantes, non?

Jack Twain

Correct @AlexTwain

samthebest

Pouvez-vous me fournir un tutoriel / papier qui en parle? Je ne trouve aucun tutoriel / papier systématique!

Jack Twain

Eh bien, la page wiki est plutôt bonne, vous pouvez suivre les références là-bas si vous voulez vraiment en.wikipedia.org/wiki/Latent_variable

samthebest

1

@JackTwain l'analogie PCA correcte est que les caractéristiques latentes sont les vecteurs propres. Les principales composantes sont les poids attribués à chaque observation pour les principaux vecteurs propres. Dans d'autres modèles de factorisation matricielle, les caractéristiques latentes jouent le rôle des vecteurs propres. Cela peut sembler pédant, mais l'erreur ne crée pas de confusion pour les gens.

conjectures

3

Dans le contexte de la méthode de factorisation, les caractéristiques latentes sont généralement destinées à caractériser les éléments le long de chaque dimension. Je m'explique par l'exemple.

$R$ $R_{ui}$ $p_u^T q_i$ $p_u$ $u$ $q_i$ $i$

$p_u$ $q_i$

Artem Sobolev
la source

J'ai lu des articles où les fonctionnalités latentes (par exemple le "vecteur utilisateur") sont utilisées pour prédire certaines variables cibles, utilisons le sexe comme exemple. Cela «fonctionne» en ce sens qu'un modèle prédictif peut être construit de cette façon. Ma question est quelle est la différence entre le "vecteur utilisateur" et, disons, la moyenne des "vecteurs d'article" pour tous les articles qu'un utilisateur a "visités"? IOW, vous attendriez-vous à ce que le modèle prédictif mentionné ci-dessus soit meilleur ou pire avec l'un par rapport à l'autre? Merci (si jamais vous voyez ça).

thecity2

@ thecity2, vous pouvez faire la moyenne des éléments de l'utilisateur, ce qui peut être utile lorsque vous traitez avec de nouveaux arrivants pour lesquels vous n'avez pas de vecteurs utilisateur précalculés (bien qu'il devrait être difficile d'exécuter quelques itérations d'optimisation pour le calculer). Il y a aussi un problème avec la moyenne simple: plus l'utilisateur a consommé d'articles - plus son vecteur moyen est proche de zéro (en raison du régularisateur L2 typique, et peut-être d'autres propriétés désagréables des espaces de grande dimension). Enfin, avoir un vecteur séparé est plus flexible: votre modèle peut apprendre une telle moyenne.

Artem Sobolev

Cela dit, il existe des tentatives d'utilisation de l'historique de l'utilisateur pour modéliser le vecteur de l'utilisateur. Par exemple, consultez l'article "Créez votre propre recommandation de musique en modélisant des flux de radio Internet"

Artem Sobolev

0

Je dirais que les facteurs sont plus représentatifs que les composantes principales pour avoir une perception de la «latence» / de la dissimulation d'une variable. La latence est l'une des raisons pour lesquelles les spécialistes du comportement mesurent les constructions perceptuelles comme le sentiment, la tristesse en termes de plusieurs éléments / mesures et dérivent un nombre pour ces variables cachées qui ne peuvent pas être mesurées directement.

KarthikS
la source

0

Ici, vos données sont des notes attribuées par divers utilisateurs à divers films. Comme d'autres l'ont souligné, la latence ne signifie pas directement observable.

Pour un film, ses caractéristiques latentes déterminent la quantité d'action, de romance, de scénario, d'un acteur célèbre, etc. De même, pour un autre ensemble de données composé de chiffres manuscrits, les variables latentes peuvent être l'angle des bords, l'inclinaison, etc.

explorateur
la source

Signification des caractéristiques latentes?

Réponses: