Problème de pratique de l'algorithme EM

9

Il s'agit d'un problème de pratique pour un examen à mi-parcours. Le problème est un exemple d'algorithme EM. J'ai des problèmes avec la partie (f). J'énumère les parties (a) - (e) à compléter et au cas où j'aurais fait une erreur plus tôt.

Soit des variables aléatoires exponentielles indépendantes avec un taux . Malheureusement, les valeurs réelles ne sont pas observées, et nous observons uniquement si les valeurs tombent dans certains intervalles. Soit , , et G_ { 3j} = \ mathbb {1} \ left \ {X_j> 2 \ right \} pour j = 1, \ ldots, n . Les données observées sont constituées de (G_ {1j}, G_ {2j}, G_ {3j}) .X1,,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2} j = 1 , , nG3j=1{Xj>2}j=1,,n(G1j,G2j,G3j)

(a) Donner la probabilité des données observées:

L(θ|G)=j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=j=1n(1eθ)G1j(eθe2θ)G2j(e2θ)G3j

(b) Donner la probabilité complète des données

L(θ|X,G)=j=1n(θeθxj)G1j(θeθxj)G2j(θeθxj)G3j

(c) Dériver la densité prédictive de la variable latente f(xj|G,θ)

f(xj|G,θ)=fX,G(xj,g)fG(g)=θeθxj1{xjregion r s.t. Grj=1}(1eθ)g1j(eθe2θ)g2j(e2θ)g3j

(d) E-étape. Donnez la fonctionQ(θ,θi)

Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθe2θ)N3loge2θ=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθ(1eθ))+2θN3=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3

N1=j=1ng1j,N2=j=1ng2j,N3=j=1ng3j

(e) Donner des expressions pour pour . r = 1 , 2 , 3E[Xj|Grj=1,θi]r=1,2,3

Je vais énumérer mes résultats qui, j'en suis sûr, ont raison, mais les dérivations seraient un peu longues pour cette question déjà longue:

E[Xj|G1j=1,θi]=(11eθi)(1θieθi(1+1/θi))E[Xj|G2j=1,θi]=(1eθie2θi)(eθi(1+1/θi)e2θi(2+1/θi))E[Xj|G3j=1,θi]=(1e2θi)(e2θi(2+1/θi))

C'est la partie sur laquelle je suis coincé, et cela pourrait être dû à une erreur antérieure:

(f) Étape M. Trouvez le qui maximiseQ ( θ , θ i )θQ(θ,θi)

D'après la loi de l'espérance totale, nous avons ainsi tousE[Xj|G,θi]=(1θieθi(1+1/θi))+(eθi(1+1/θi)e2θi(2+1/θi))+(e2θi(2+1/θi))=1/θi

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3=nlogθθnθiN1log(1eθ)+θN2N2log(1eθ)+2θN3Q(θ,θi)θ=nθnθi(N1+N2)eθ1eθ+N2+2N3

Ensuite, je devrais mettre cela égal à zéro et résoudre pour , mais j'ai essayé cela depuis très longtemps et je n'arrive pas à résoudre pour !θθθ

bdeonovic
la source
J'interprétais en tant que puissance de pendant une minute. Le plus déroutant. Habituellement, le numéro d'itération (numéro d'étape) est placé entre crochets ou entre parenthèses afin que ne soit pas confondu avec le ème pouvoir . Il vaut probablement mieux dire au moins que c'est ce que c'est dans la question (en supposant que j'ai maintenant raison). θ [ i ] ( i ) θ ( i ) i θ iθiθ[i](i)θ(i)iθi
Glen_b -Reinstate Monica
1
Oui Glen, désolé, c'est bien l' ième itération de l'algorithme EM. i
bdeonovic

Réponses:

5

La probabilité de données complètes ne doit pas impliquer G! Cela devrait simplement être la probabilité de lorsque les sont exponentiels. Notez que la probabilité de données complète telle que vous l'avez écrite se simplifie en une probabilité exponentielle car un seul des peut être 1. Laisser les dans la probabilité de données complètes, cependant, vous gâche plus tard. X G r j GθXGrjG

Dans la partie (d), il faut tenir compte de la vraisemblance complète du journal de données, et non de la probabilité observée du journal de données.

De plus, vous ne devriez pas utiliser la loi de l'attente totale! Rappelez-vous que G est observé et n'est pas aléatoire, vous ne devez donc effectuer qu'une seule de ces attentes conditionnelles pour chaque . Remplacez simplement cette attente conditionnelle par le terme , puis effectuez l'étape M.X ( i ) jXjXj(i)

jsk
la source
@Benjamin Comment se passe le problème? Ai-je pu vous aider à comprendre comment le faire?
jsk
Merci pour les commentaires @jsk. J'étais fatigué la nuit dernière alors je suis allé me ​​coucher, mais je m'attaquerai à nouveau à ce problème ce matin après le petit déjeuner :)
bdeonovic
Je pense que je l'ai compris! Merci encore! C'était en fait en préparation d'une finale que j'ai aujourd'hui, donc cela a vraiment aidé à clarifier certaines choses à propos de l'EM.
bdeonovic
Je vous en prie. J'espère que votre finale se passera bien aujourd'hui!
jsk
4

Sur la base des commentaires de @ jsk, je vais essayer de remédier à mes erreurs:

L(θ|X,G)=j=1nθeθxj

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]=nlogθθ(j=1ng1j1eθi)(1θieθi(1+1/θi))θ(j=1ng2jeθi(1eθi))(eθi(1+1/θi)e2θi(2+1/θi))θ(j=1ng3je2θi)(e2θi(2+1/θi))=nlogθθN1AθN2BθN3CQ(θ,θi)θ=nθN1AN2BN3C=set0

en résolvant pour on obtientθ ( i + 1 ) = nθθ(i+1)=nN1A+N2B+N3C

bdeonovic
la source