Quelle est la variance du mélange pondéré de deux gaussiennes?

39

Supposons que j'ai deux distributions normales A et B avec les moyennes et et les variances et . Je veux prendre un mélange pondéré de ces deux distributions en utilisant les poids et où et . Je sais que la moyenne de ce mélange serait .μAμBσAσBpq0p1q=1pμAB=(p×μA)+(q×μB)

Quelle serait la variance?


Un exemple concret serait si je connaissais les paramètres de répartition de la taille des hommes et des femmes. Si j'avais une pièce composée à 60% d'hommes, je pourrais produire la hauteur moyenne attendue pour toute la pièce, mais qu'en est-il de la variance?

JoFrhwld
la source
Concernant la terminologie: le mélange a simplement une moyenne et une variance; Il est inutile de les qualifier d '"attendues", à moins que vous ne laissiez entendre que et devraient être considérés comme des variables aléatoires. pq
whuber
Je sais que le mélange de deux distributions gaussiennes est identifiable. Mais si les deux distributions ont les mêmes émans? Par exemple, le mélange de deux distributions normales avec les mêmes moyennes et des écarts types différents est-il identifiable? Il y a des papiers dans ce contexte? Merci d'avance
1
Il y a une question similaire avec des réponses ( qui traitent également les covariances) ici: math.stackexchange.com/q/195911/96547
hplieninger

Réponses:

63

La variance est le deuxième moment moins le carré du premier moment, il suffit donc de calculer des moments de mélanges.

En général, étant donné les distributions avec PDFs et les poids constants (non aléatoires) , le PDF du mélange estfipi

f(x)=ipifi(x),

à partir de laquelle il suit immédiatement pour tout moment quek

μ(k)=Ef[xk]=ipiEfi[xk]=ipiμi(k).

J'ai écrit pour le moment de et pour le moment de .μ(k)kthfμi(k)kthfi

En utilisant ces formules, la variance peut être écrite

Var(f)=μ(2)(μ(1))2=ipiμi(2)(ipiμi(1))2.

De façon équivalente, si les variances du sont données sous la forme , alors , permettant d' écrire la variance du mélange en termes de variances et de moyennes de ses composants ainsi quefiσi2μi(2)=σi2+(μi(1))2f

Var(f)=ipi(σi2+(μi(1))2)(ipiμi(1))2=ipiσi2+ipi(μi(1))2(ipiμi(1))2.

En mots, il s’agit de la variance moyenne (pondérée) plus la moyenne quadratique moyenne moins le carré de la moyenne. Parce que la quadrature est une fonction convexe, Inégalité de Jensen affirme que la moyenne quadratique moyenne ne peut être inférieure au carré de la moyenne moyenne. Cela nous permet de comprendre la formule en indiquant que la variance du mélange est le mélange des variances plus un terme non négatif représentant la dispersion (pondérée) des moyennes.

Dans votre cas, la variance est

pAσA2+pBσB2+[pAμA2+pBμB2(pAμA+pBμB)2].

Nous pouvons interpréter cela comme un mélange pondéré des deux variances, , plus un terme de correction (nécessairement positif) pour tenir compte des écarts entre les moyennes individuelles et la moyenne globale des mélanges.pAσA2+pBσB2

L'utilité de cette divergence dans l'interprétation des données, telle que donnée dans la question, est douteuse, car la distribution du mélange ne sera pas normale (et peut s'en écarter sensiblement, au point de montrer une bimodalité).

whuber
la source
8
Notant en particulier que , votre dernière expression se simplifie comme . pA+pB=1σ2=μ(2)μ2=pAσA2+pBσB2+pApB(μAμB)2
Ilmari Karonen
2
Ou, si nous imposons une explication probabiliste à une densité de mélange (il existe un événement de probabilité et la densité conditionnelle de étant donné est tandis que la densité conditionnelle de étant donnée est ), alors var est la somme de la moyenne de la variance conditionnelle plus la variance de la moyenne conditionnelle. Ce dernier est un RV discret avec les valeurs avec les probabilités etApAXAN(μA,σA2)XAc=BN(μB,σB2)(X)YμA,μBpqet votre expression entre crochets est facilement reconnue comme étant . E[Y2](E[Y])2
Dilip Sarwate
1
@Neodyme Par définition, la variance est le deuxième moment moins la moyenne au carré. Par conséquent, le deuxième moment est la variance plus la moyenne au carré.
whuber
1
@Neodyme utilise . E(X)=μ
whuber
1
@ Kiran Bien que, dans certains cas, le mélange puisse sembler normal, il ne le sera pas. Une façon de voir cela est de calculer son kurtosis en excès en utilisant les formules données ici. Il sera non nul à moins que tous les écarts-types ne soient égaux - dans ce cas, le "mélange" n'est pas vraiment un mélange en premier lieu.
whuber