Le lemme de Johnson-Lindenstrauss permet de représenter des points dans un espace de grande dimension en points de dimension inférieure. Lors de la recherche d'espaces de dimension inférieure de meilleur ajustement, une technique standard consiste à trouver la décomposition des valeurs singulières, puis à prendre le sous-espace généré par les plus grandes valeurs singulières. Quand est-il intéressant d'utiliser Johnson-Lindenstrauss sur le SVD?
la source
SVD et JL extrapolent également aux points futurs différemment.
Autrement dit, si vous supposez que vos données proviennent d'une distribution sous-jacente, en principe, le SVD doit rester "bon" pour tous les points futurs tant qu'ils sont échantillonnés à partir de la même distribution. D'un autre côté, la dimension cible de JL dépend du nombre de points, ce qui signifie que l'application d'une transformation JL à des points supplémentaires peut augmenter la probabilité d'erreur.
Cela devient pertinent si, par exemple, si vous utilisez la réduction de dimensionnalité comme étape de prétraitement pour un autre algorithme. Les limites SVD pour les données d'entraînement peuvent contenir des données de test, mais pas JL.
la source
Ceci est un suivi de la réponse de Suresh - j'ai googlé un peu après avoir lu sa réponse et j'ai trouvé la compréhension suivante. Au départ, j'allais poster ceci en tant que commentaire à sa réponse, mais cela a continué d'augmenter.
Veuillez signaler des erreurs dans la réponse, je ne suis pas un expert dans ce domaine.
Dans un certain sens, JL et SVD sont comme des pommes et des oranges.
1) Les problèmes qu'ils résolvent sont complètement différents. L'un concerne les distances par paires, l'autre la meilleure représentation. L'un est le pire des cas, l'autre est le cas moyen.
(Ce n'est pas précis, je commenterai cela plus tard)
3) JL est non constructif, SVD est constructif - ce point est un peu vague, car le terme constructif n'est pas défini avec précision. Il existe des algorithmes déterministes pour calculer la SVD, mais l'algorithme pour trouver un espace JL est aléatoire - faites des projections aléatoires, si vous échouez, essayez à nouveau.(Voir les commentaires pour des explications concernant les parties rayées de la réponse).
Edit: @ john-myles-white a écrit un article sur JL pour vérifier ses affirmations et montrer comment une projection peut être construite: http://www.johnmyleswhite.com/notebook/2014/03/24/a-note- on-the-johnson-lindenstrauss-lemma /
la source