Regroupement avec des mesures de distance asymétriques

9

Comment regrouper une entité avec une mesure de distance asymétrique?

Par exemple, supposons que vous regroupiez un ensemble de données avec des jours de la semaine comme entité - la distance du lundi au vendredi n'est pas la même que la distance du vendredi au lundi.

Comment intégrez-vous cela dans la mesure de distance de l'algorithme de clustering?

Michael
la source

Réponses:

3

Si la distance MF est asymétrique parce que l'avenir est différent du passé, alors un véritable regroupement asymétrique est nécessaire. Premièrement, une fonction de distance asymétrique doit être définie.

Une façon de procéder à un regroupement asymétrique, étant donné une fonction de distance, consiste à intégrer les données d'origine dans un nouvel espace de coordonnées. Voir «Structures géométriques de certains modèles sans distance pour les MDS asymétriques» par Naohito Chino et Kenichi Shiraiwa, Behaviormetrika, 1992 ( pdf ). C'est ce qu'on appelle HCM (le modèle canonique hermitien).

H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

Cela transforme les données en un espace de nombres complexes. Une fois les données incorporées, la distance entre les objets x et y n'est plus que x * y, où * est le transposé conjugué. À ce stade, vous pouvez exécuter k-means sur les vecteurs complexes.

Un regroupement spectral asymétrique a également été effectué, voir la thèse de Stefan Emilov Atev, «Using Asymmetry in the Spectral Clustering of Trajectories», Université du Minnesota, 2011, qui donne le code MATLAB pour un algorithme spécial.

andy_a
la source
1

Vous pouvez prendre une sorte de moyenne (comme une moyenne arithmétique ou, pour les distributions de probabilité, la racine carrée de la divergence Jensen – Shannon.)

cyborg
la source
1

Vous devriez jeter un œil aux statistiques circulaires (si vous voulez travailler "dans" une semaine de réglage)

Lionel
la source
1

XXTX

|days apart|

xD

Jessica Collins
la source