Comment la distance de Gower calcule-t-elle la différence entre les variables binaires?

13

J'ai 17 variables numériques et 5 variables binaires (0-1), avec 73 échantillons dans mon jeu de données. J'ai besoin d'exécuter une analyse de cluster. Je sais que la distance de Gower est une bonne métrique pour les ensembles de données avec des variables mixtes. Cependant, je ne pouvais pas comprendre comment la distance de Gower calcule la différence entre les variables binaires . Il me semble que ce n'est pas différent de la distance euclidienne.

Emrah Bilgiç
la source
Votre question n'est pas tout à fait claire. Demandez-vous simplement «comment la distance de Gower calcule-t-elle la différence entre les variables binaires»? Que signifie "il n'y a pas de différence avec Euclidienne"?
gung - Réintégrer Monica
1
Je vous remercie. Désolé, je demande comment Gower calcule la différence entre les variables binaires. Je veux dire, je ne pouvais pas comprendre les différences entre les deux. Euclidienne et Gower pour variable binaire.
Emrah Bilgiç
Avez-vous recherché ce site Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Oui je l'ai fait. La distance euclidienne est 0, si les deux échantillons ont la même valeur, 1 sinon. Et Gower?
Emrah Bilgiç
4
@ EmrahBilgiç, la métrique de Gower est la similitude, pas la distance. Il devient "distance" lorsqu'il est soustrait de 1. Lisez sous le lien ci-dessus comment il traite les données binaires.
ttnphns

Réponses:

5

Que diriez-vous des attributs binaires qui ont les valeurs "m" et "f", pour "mâle" et "femelle"?

Vous vous rendez compte que pour une variable dicotomique, tout ce que vous pouvez en tirer est "identique" ou "différent"? La différence de point clé entre les distances n'est pas si la valeur est 1 ou 0; mais comment plusieurs variables sont combinées.

A QUIT - Anony-Mousse
la source
3

Gower distance utilise Manhattan pour calculer la distance entre les points de données continus et Dice pour calculer la distance entre les points de données catégoriels

Sanjeet
la source