Quelle est la signification des axes dans t-SNE?

12

J'essaie actuellement de faire le tour de la mathématique t-SNE . Malheureusement, il y a encore une question à laquelle je ne peux pas répondre de manière satisfaisante: quelle est la signification réelle des axes dans un graphique t-SNE? Si je devais faire une présentation sur ce sujet ou l'inclure dans une publication: comment étiqueter les axes de manière appropriée?

PS: J'ai lu cette question sur Reddit mais les réponses qui y sont données (telles que "cela dépend de l'interprétation et des connaissances du domaine"), ne m'aident pas vraiment à comprendre cela.

Hagbard
la source

Réponses:

20

Les axes individuels dans t-SNE n'ont aucune signification.

Les algorithmes tels que MDS, SNE, t-SNE, etc. ne se soucient que des distances par paires entre les points. Ils essaient de positionner les points sur un plan de telle sorte que les distances par paire entre eux minimisent un certain critère. Cela signifie que si vous prenez un tracé t-SNE et le faites pivoter, l'arrangement résultant sera également bon en ce qui concerne t-SNE. La rotation globale que vous retirez de l'algorithme t-SNE est donc arbitraire.

Pour étiqueter les axes, je recommande d'écrire quelque chose comme "t-SNE dimension 1" et "t-SNE dimension 2".

(Parfois, les gens écrivent "t-SNE 1" et "t-SNE 2" ou quelque chose de ce genre, ce qui est bâclé. Parfois, je vois "t-SNE composant 1" et "t-SNE composant 2"; mais je pense que le mot "composant" ne fonctionne pas très bien dans ce contexte.)

amibe dit réintégrer Monica
la source
2
Un corollaire à cette réponse est que la suggestion de Reddit est un peu fausse. Il n'y a probablement pas de manière raisonnable d'interpréter les axes en général, même si vous avez des connaissances de domaine à appliquer.
shadowtalker
3
Un autre corollaire de cette réponse est que les axes doivent être affichés sur la même échelle, de sorte que si vous multipliez par une matrice de rotateurs et inclinez la tête en conséquence, l'intrigue aurait exactement la même apparence. C'est malheureusement loin de la pratique courante (grognement!).
eric_kernfeld