Quand utiliser le modèle de mélange gaussien?

9

Je suis novice dans l'utilisation des GMM. Je n'ai pas pu trouver d'aide en ligne appropriée. Quelqu'un pourrait-il me fournir la bonne ressource sur "Comment décider si l'utilisation de GMM convient à mon problème?" ou en cas de problèmes de classification "Comment décider si je dois utiliser la classification SVM ou GMM?"

Vinay
la source
quel est votre jeu de données et quel est votre problème exact? Il est utilisé lorsque les données suivent (sont un mélange de) plus d'une distribution normale. Voir une autre question - stats.stackexchange.com/questions/236295/…
Arpit Sisodia
Vous pouvez le considérer comme une forme de clustering où vous n'avez pas de données étiquetées et pensez que les regroupements latents sont parfaitement normaux à plusieurs variables.
gung - Rétablir Monica
@ arpit-sisodia, Nous travaillons sur la faisabilité d'une configuration de clavier matériel qui semble avoir des fonctionnalités spécifiques et nous prévoyons de la modéliser à l'aide de GMM. Nous ne connaissons pas clairement le processus sous-jacent et nous essayons donc de modéliser à l'aide de méthodes d'apprentissage automatique. Donc, nous ne savons pas s'il y a réellement un mélange de gaussiens dans le processus sous-jacent. De plus, il est multidimensionnel et nous ne pouvons pas le visualiser pour voir s'il s'agit d'un mélange de gaussiens
Vinay
@ arpit-sisodia, le lien que vous avez fourni suggère plus de méthode d'essai et d'erreur pour voir si GMM correspond à mes données. Existe-t-il une manière concluante / règle de pouce pour décider des modèles à utiliser. La méthode d'essai et d'erreur pour jouer avec plus de mélanges peut s'adapter à mes données. Mais existe-t-il une certaine manière de décider? Comme nous avons besoin d'une séparabilité linéaire des données pour la classification SVM
Vinay

Réponses:

4

À mon avis, vous pouvez effectuer du GMM lorsque vous savez que les points de données sont des mélanges d'une distribution gaussienne. Formation de grappes de base avec différentes moyennes et écarts-types. Il y a un joli diagramme sur le site Web de scikit-learn. L

Classification GMM

Une approche consiste à trouver les clusters à l'aide de méthodes de clustering doux, puis à voir s'ils sont gaussiens. Si tel est le cas, vous pouvez appliquer un modèle GMM qui représente l'ensemble de données entier.

Slayer
la source
1
souvent, nous ne savons pas si les points de données sont un mélange de gaussiens. Donc, c'est plus un jeu avec gaussien et MoG et voir si cela convient. Mais il n'y a pas de directions / règles à suivre pour utiliser GMM à droite
Vinay
2
Selon mon expérience, vous devez trouver le motif dans les données que c'est un modèle de mélange. Un bon article à lire serait le suivant: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer
0

Les MGM sont généralement un bon point de départ si votre objectif est de (1) regrouper les observations, (2) spécifier un modèle génératif, ou (3) estimer les densités. En fait, pour le clustering, les GMM sont un surensemble de k-moyennes.

1_e
la source