J'ai des données qui représentent un aspect du comportement humain. Je veux le regrouper (sans surveillance) en profils comportementaux d'une certaine sorte. maintenant, certaines de mes variables sont catégoriques (avec 2 catégories ou plus), et certaines sont continues (la plupart sont des pourcentages). Quelques variables sont encore plus complexes dans la mesure où une catégorie est plus continue et l'autre n'a pas de telles données supplémentaires.
Ma question est de savoir comment classer ces données. Quelles sont les approches (courantes?) Pour y faire face?
Je n'ai pas besoin de code ou de quoi que ce soit, mais plutôt de références ou de directives qui m'aideront à mieux comprendre comment relever ce défi.
Si vous connaissez des R
fonctions qui facilitent une telle analyse, ce serait bien, mais ce n'est pas nécessaire.
Merci.
Réponses:
la source
Voir https://cran.r-project.org/web/packages/ClustOfVar pour le package R
ClustOfVar
. Il semble implémenter certaines des meilleures méthodes de clustering disponibles pour les mélanges de types variables.la source