Dans quelles situations devrions-nous utiliser t-SNE (en dehors de la visualisation des données)?
T-SNE est utilisé pour la réduction de dimensionnalité. La réponse à cette question suggère que t-SNE devrait être utilisé uniquement pour la visualisation et que nous ne devrions pas l'utiliser pour le clustering. Alors, quelle est la bonne utilisation du t-SNE?
Réponses:
Je ne suis pas d'accord avec cette conclusion. Il n'y a aucune raison de supposer que t-SNE est pire universellement que tout autre algorithme de clustering. Chaque algorithme de clustering fait des hypothèses sur la structure des données, et on peut s'attendre à ce qu'elles fonctionnent différemment selon la distribution sous-jacente et l'utilisation finale de la dimensionnalité réduite.
Le t-SNE, comme de nombreux algorithmes d'apprentissage non supervisés, fournit souvent un moyen de parvenir à une fin, par exemple en obtenant un aperçu précoce de la séparabilité ou non des données, en testant qu'elles ont une structure identifiable et en inspectant la nature de cette structure. Il n'est pas nécessaire de visualiser la sortie t-SNE pour commencer à répondre à certaines de ces questions. D'autres applications des plongements de dimension inférieure incluent la construction de caractéristiques pour la classification ou l'élimination de la multi-colinéarité pour améliorer les performances des méthodes de prédiction.
la source