Autant que je sache, les MOS de style Kohonen ont connu un pic vers 2005 et n’ont pas suscité autant de faveur récemment. Je n'ai trouvé aucun article indiquant que les MOS ont été assimilés par une autre méthode ou prouvés équivalents à autre chose (de toute façon à des dimensions plus élevées). Mais il semble que tSNE et d'autres méthodes prennent beaucoup plus d'encre de nos jours, par exemple dans Wikipedia ou dans SciKit Learn, et que SOM est davantage citée en tant que méthode historique.
(En fait, un article de Wikipedia semble indiquer que les MOS ont toujours certains avantages sur leurs concurrents, mais qu’il s’agit également de l’entrée la plus courte de la liste. EDIT: À la demande de Pergung, l’un des articles auquel je pense est le suivant: Réduction de la dimensionnalité non linéaire Notez que SOM a moins écrit à ce sujet que les autres méthodes. Je ne trouve pas l’article qui mentionne un avantage que les SOM semblent conserver par rapport à la plupart des autres méthodes.)
Des idées? Quelqu'un d'autre a demandé pourquoi les MOS ne sont pas utilisées et a obtenu des références il y a quelque temps. J'ai trouvé des comptes rendus de conférences SOM, mais je me demandais si l'essor des SVM ou de la tSNE, et autres, venait d'éclipser les SOM dans l'apprentissage automatique.
EDIT 2: Par pure coïncidence, je venais de lire ce soir une étude de 2008 sur la réduction de la dimensionnalité non linéaire, citée à titre d’exemple: Isomap (2000), intégration linéaire locale (LLE) (2000), Hessian LLE (2003), Laplacien les cartes propres (2003) et l’intégration semi-définie (SDE) (2004).
Réponses:
Je pense que vous êtes sur la bonne voie en notant l’influence de ce que l’apprentissage par la machine vante actuellement comme le "meilleur" algorithme de réduction de dimensionnalité. Bien que t-SNE ait démontré son efficacité dans des compétitions telles que le Merck Viz Challenge , j'ai personnellement réussi à implémenter SOM pour l'extraction de caractéristiques et la classification binaire. Bien que certains rejettent les MOS sans justification en dehors de l'âge de l'algorithme (consultez cette discussion , un certain nombre d'articles publiés ces dernières années ont mis en œuvre des SOM et obtenu des résultats positifs (voir Mortazavi et al. 2013 ; Frenkel et al., 2013par exemple). Une recherche Google Scholar révélera que les fichiers SOM sont toujours utilisés dans un certain nombre de domaines d'application. En règle générale, cependant, le meilleur algorithme pour une tâche particulière est exactement cela: le meilleur algorithme pour une tâche particulière. Là où une forêt aléatoire peut avoir bien fonctionné pour une tâche de classification binaire particulière, elle peut avoir des performances horribles sur une autre. La même chose s'applique aux tâches de clustering, de régression et d'optimisation. Ce phénomène est lié au théorème «Pas de repas gratuit» , mais c'est un sujet pour une autre discussion. En résumé, si SOM fonctionne le mieux pour vous dans une tâche particulière, c'est l'algorithme que vous devez utiliser pour cette tâche, quelle que soit sa popularité.
la source
J'ai effectué des recherches sur la comparaison des MOS avec le t-SNE et plus encore et j'ai également proposé une amélioration du MOS qui lui permet d'atteindre un nouveau niveau d'efficacité. S'il vous plaît vérifier ici et laissez-moi savoir vos commentaires. J'adorerais avoir une idée de ce que les gens en pensent et s'il vaut la peine d'être publié en python.
Lien IEEE vers le document: http://ieeexplore.ieee.org/document/6178802/
Implémentation Matlab. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase
Merci pour vos commentaires.
la source
Mon point de vue subjectif est que les MOS sont moins connues et perçues comme moins «sexy» que de nombreuses autres méthodes, mais restent très pertinentes pour certaines catégories de problèmes. Il se peut qu’ils aient une contribution importante à faire s’ils étaient utilisés plus largement. Ils sont inestimables dans les débuts de la science exploratoire des données pour avoir une idée du «paysage» ou de la «topologie» des données multivariées.
Le développement de bibliothèques telles que Somoclu et des recherches telles que celle de Guénaël Cabanes (parmi beaucoup d'autres) montrent que les MOS sont toujours d'actualité.
la source