Quelqu'un peut-il me dire les facteurs qui affectent les besoins en mémoire de -signifie un regroupement avec un peu d'explication?
clustering
k-means
Martin
la source
la source
Réponses:
Des algorithmes comme Lloyds peuvent être implémentés aveck ⋅ ( 2 ⋅ d+1 ) valeurs en virgule flottante mémoire uniquement. L'algorithme k-means de MacQueens ne devrait avoir besoink ⋅ ( d+ 1 ) Mémoire.
Cependant, comme la plupart des utilisateurs voudront savoir quel point appartient à quel cluster, presque toutes les implémentations que vous trouverez utiliserontO ( n + k ⋅ d) Mémoire.
En d'autres termes, l'utilisation de la mémoire par k-means est essentiellement la taille des données de sortie .
la source
Je suis récemment tombé sur une note d'une implémentation scipy de l'algorithme k-means dans scipy.cluster.vq.py
la source