Quelle est la bonne utilisation de t-SNE, en dehors de la visualisation des données?

Dans quelles situations devrions-nous utiliser t-SNE (en dehors de la visualisation des données)?

T-SNE est utilisé pour la réduction de dimensionnalité. La réponse à cette question suggère que t-SNE devrait être utilisé uniquement pour la visualisation et que nous ne devrions pas l'utiliser pour le clustering. Alors, quelle est la bonne utilisation du t-SNE?

data-visualization dimensionality-reduction tsne Wolfe
la source

Le conseil standard est de NE PAS utiliser tsne pour le clustering, car les clusters dépendent tellement de la perplexité. Il est censé être utilisé uniquement pour la "visualisation". Mais cela n'est pas très clair pour moi, car on cherche immédiatement (et voit) des grappes en regardant une intrigue tsne. Par conséquent, votre question est bonne: à quoi sert tsne?

generic_user

Voir la réponse à cette question que j'ai posée: stats.stackexchange.com/questions/263539/…

generic_user

comme l'a dit @generic_user, je veux connaître les avantages de t-sne, à côté de sa visualisation.

Wolfe

Je ne sais pas pourquoi cela a été fermé en double. OP demande quelles sont les bonnes utilisations de t-sne en dehors de la visualisation. Le thread lié concerne le clustering. Mais il pourrait y avoir d'autres utilisations.

amoeba

Connexes: stats.stackexchange.com/questions/132639/…

Amelio Vazquez-Reina

Réponses:

La réponse à cette question suggère que t-SNE devrait être utilisé uniquement pour la visualisation et que nous ne devrions pas l' utiliser pour le clustering. Alors, quelle est la bonne utilisation du t-SNE?

Je ne suis pas d'accord avec cette conclusion. Il n'y a aucune raison de supposer que t-SNE est pire universellement que tout autre algorithme de clustering. Chaque algorithme de clustering fait des hypothèses sur la structure des données, et on peut s'attendre à ce qu'elles fonctionnent différemment selon la distribution sous-jacente et l'utilisation finale de la dimensionnalité réduite.

Le t-SNE, comme de nombreux algorithmes d'apprentissage non supervisés, fournit souvent un moyen de parvenir à une fin, par exemple en obtenant un aperçu précoce de la séparabilité ou non des données, en testant qu'elles ont une structure identifiable et en inspectant la nature de cette structure. Il n'est pas nécessaire de visualiser la sortie t-SNE pour commencer à répondre à certaines de ces questions. D'autres applications des plongements de dimension inférieure incluent la construction de caractéristiques pour la classification ou l'élimination de la multi-colinéarité pour améliorer les performances des méthodes de prédiction.

Amelio Vazquez-Reina
la source