Je citerai la FAQ du site Web de t-SNE . D'abord pour la perplexité:
Comment dois-je régler la perplexité dans t-SNE?
Les performances du t-SNE sont assez robustes sous différents réglages de la perplexité. La valeur la plus appropriée dépend de la densité de vos données. En gros, on pourrait dire qu'un ensemble de données plus grand / plus dense nécessite une perplexité plus grande. Les valeurs typiques de la perplexité varient entre 5 et 50.
Pour tous les autres paremètres, je considérerais de lire ceci:
Comment puis-je évaluer la qualité des visualisations construites par t-SNE?
De préférence, regardez-les! Notez que le t-SNE ne conserve pas les distances mais les probabilités, il est donc inutile de mesurer certaines erreurs entre les distances euclidiennes en D élevé et en D faible. Cependant, si vous utilisez les mêmes données et la même perplexité, vous pouvez comparer les divergences Kullback-Leibler signalées par t-SNE. Il est parfaitement possible d'exécuter t-SNE dix fois et de sélectionner la solution avec la divergence KL la plus faible.
En d'autres termes, cela signifie: regardez l'intrigue, si la visualisation est bonne, ne modifiez pas les paramètres. Vous pouvez également choisir la course avec la divergence KL la plus faible pour chaque perplexité fixe.