La publication originale de MacQueen k-means (la première à utiliser le nom "kmeans") est un algorithme en ligne.
MacQueen, JB (1967). «Quelques méthodes pour la classification et l'analyse des observations multivariées». Actes du 5e Symposium de Berkeley sur les statistiques mathématiques et les probabilités 1. University of California Press. pp. 281-297
Après avoir attribué chaque point, la moyenne est mise à jour progressivement à l'aide d'une simple formule moyenne pondérée (l'ancienne moyenne est pondérée avec n, la nouvelle observation est pondérée avec 1, si la moyenne avait n observations auparavant).
Pour autant que je sache, il s'agissait également d'un seul passage sur les données uniquement, bien qu'il puisse être répété de manière triviale plusieurs fois pour réaffecter des points jusqu'à la convergence.
MacQueen prend généralement moins d'itérations que Lloyds pour converger si vos données sont mélangées (car elles mettent à jour la moyenne plus rapidement!). Sur les données commandées, cela peut avoir des problèmes. En revanche, cela nécessite plus de calcul pour chaque objet, donc chaque itération prend un peu plus de temps (opérations mathématiques supplémentaires, évidemment).
A QUIT - Anony-Mousse
la source