Il existe une très grande variété de méthodes de clustering, qui sont de nature exploratoire, et je ne pense pas que l'une d'entre elles, qu'elle soit hiérarchique ou basée sur une partition, s'appuie sur le type d'hypothèses à respecter pour analyser la variance.
Après avoir regardé la documentation [MV] dans Stata pour répondre à votre question, j'ai trouvé cette citation amusante à la page 85:
Bien que certains aient dit qu'il existe autant de méthodes d'analyse de clusters que de personnes effectuant une analyse de clusters. C'est un euphémisme grossier! Il existe infiniment plus de façons d'effectuer une analyse de cluster que les personnes qui les effectuent.
Dans ce contexte, je doute qu'il existe des hypothèses applicables à travers la méthode de clustering. Le reste du texte établit simplement comme règle générale que vous avez besoin d'une certaine forme de "mesure de dissimilarité", qui n'a même pas besoin d'être une distance métrique, pour créer des grappes.
Il existe cependant une exception, lorsque vous regroupez des observations dans le cadre d'une analyse post-estimation. Dans Stata, la vce
commande est accompagnée de l'avertissement suivant, à la page 86 de la même source:
Si vous connaissez le large éventail de commandes d'estimation de Stata, veillez à faire la distinction entre l'analyse de cluster (la commande de cluster) et l'option vce (cluster clustvar) autorisée avec de nombreuses commandes d'estimation. L'analyse de cluster trouve des groupes dans les données. L'option vce (cluster clustvar) autorisée avec diverses commandes d'estimation indique que les observations sont indépendantes dans les groupes définis par l'option mais ne sont pas nécessairement indépendantes au sein de ces groupes. Une variable de regroupement produite par la commande cluster satisfera rarement l'hypothèse derrière l'utilisation de l'option vce (cluster clustvar).
Sur cette base, je suppose que des observations indépendantes ne sont pas requises en dehors de ce cas particulier. Intuitivement, j'ajouterais que l'analyse par grappes pourrait même être utilisée dans le but précis d'explorer dans quelle mesure les observations sont indépendantes ou non.
Je terminerai en mentionnant qu'à la page 356 de Statistics with Stata , Lawrence Hamilton mentionne les variables standardisées comme un aspect «essentiel» de l'analyse des grappes, bien qu'il n'aille pas plus en profondeur sur la question.