Dans le filtrage collaboratif, nous avons des valeurs qui ne sont pas remplies. Supposons qu'un utilisateur n'a pas regardé un film, alors nous devons y mettre un «na».
Si je vais prendre un SVD de cette matrice, je dois y mettre un certain nombre - disons 0. Maintenant, si je factorise la matrice, j'ai une méthode pour trouver des utilisateurs similaires (en trouvant quels utilisateurs sont plus proches les uns des autres dans l'espace dimensionnel réduit). Mais la préférence prédite elle-même - pour un utilisateur à un élément sera nulle. (parce que c'est ce que nous avons entré dans les colonnes inconnues).
Je suis donc coincé avec le problème du filtrage collaboratif vs SVD. Ils semblent être presque les mêmes, mais pas tout à fait.
Quelle est la différence entre eux et que se passe-t-il lorsque j'applique un SVD à un problème de filtrage collaboratif? Je l'ai fait, et les résultats semblent acceptables en termes de recherche d'utilisateurs à proximité, ce qui est génial, mais comment?