Distribution d'échantillonnage de deux populations Bernoulli indépendantes

17

Supposons que nous avons des échantillons de deux variables aléatoires de Bernoulli indépendantes, Ber(θ1) et Ber(θ2) .

Comment prouver que

(X¯1X¯2)(θ1θ2)θ1(1θ1)n1+θ2(1θ2)n2dN(0,1)
?

Supposons que n1n2 .

Un vieil homme dans la mer.
la source
Z_i = X_1i - X_2i est une séquence de iid rv de moyenne finie et de variance. Il satisfait donc le théorème de la limite centrale de Levy-Linderberg à partir duquel vos résultats découlent. Ou demandez-vous une preuve du clt lui-même?
Three Diag
@ThreeDiag Comment appliquez-vous la version LL du CLT? Je ne pense pas que ce soit correct. Écrivez-moi une réponse pour vérifier les détails.
Un vieil homme dans la mer.
Tous les détails sont déjà là. Pour que LL s'applique, vous avez besoin d'une séquence de iid rv avec une moyenne et une variance finies. La variable Z_i = X_i1 et X_i2 satisfait aux trois exigences. L'indépendance découle de l'indépendance des deux vars bernoulli d'origine et vous pouvez voir que E (Z_i) et V (Z_i) sont finis en appliquant les propriétés standard de E et V
Three Diag
1
"échantillons de deux variables aléatoires Bernoulli indépendantes" - expression incorrecte. Doit être: "deux échantillons indépendants des distributions de Bernoulli".
Viktor
1
Veuillez ajouter "comme ". n1,n2
Viktor

Réponses:

10

Mettez ,b=a=θ1(1θ1)n1 , A=(ˉX1-θ1)/a, B=(ˉX2-θ2)/b. Nous avons AdN(0,1),BdN(0,1). En termes de fonctions caractéristiques, cela signifie ϕA(t)Eeb=θ2(1θ2)n2A=(X¯1θ1)/aB=(X¯2θ2)/bAdN(0,1), BdN(0,1) Nous voulons prouver que D:= a

ϕA(t)EeitAet2/2, ϕB(t)et2/2.
D:=aa2+b2Aba2+b2BdN(0,1)

Puisque et B sont indépendants, ϕ D ( t ) = ϕ A (AB

ϕD(t)=ϕA(aa2+b2t)ϕB(ba2+b2t)et2/2,

p=θ1, m=n1

ϕX1,1(t)=1+p(eit1),ϕX¯1(t)=(1+p(eit/m1))m,ϕX¯1θ1(t)=(1+p(eit/m1))meipt,ϕA(t)=(1+p(eit/mp(1p)1))meiptm/p(1p)=((1+p(eit/mp(1p)1))eipt/mp(1p))m=(1t22m+O(t3m3/2))m
t3m3/20t
ϕD(t)=(1a2t22(a2+b2)n1+O(n13/2))n1(1b2t22(a2+b2)n2+O(n23/2))n2et2/2
a0b0|ey(1y/m)m|y2/2m  lorsque y/m<1/2

Notez que des calculs similaires peuvent être effectués pour des distributions arbitraires (pas nécessairement de Bernoulli) avec des seconds moments finis, en utilisant l'expansion de la fonction caractéristique en termes des deux premiers moments.

Viktor
la source
Cela semble correct. Je vous reviendrai plus tard, quand j'aurai le temps de tout vérifier. ;)
Un vieil homme dans la mer.
-1

Prouver votre déclaration équivaut à prouver le (Levy-Lindenberg) Central Limit Theorem qui énonce

Si {Zi}i=1n is a sequence of i.i.d random variable with finite mean E(Zi)=μ and finite variance V(Zi)=σ2 then

n(Z¯μ)dN(0,σ2)

Here Z¯=iZi/n that is the sample variance.

Then it is easy to see that if we put

Zi=X1iX2i
with X1i,X2i following a Ber(θ1) and Ber(θ2) respectively the conditions for the theorem are satisfied, in particular

E(Zi)=θ1θ2=μ

and

V(Zi)=θ1(1θ1)+θ2(1θ2)=σ2

(There's a last passage, and you have to adjust this a bit for the general case where n1n2 but I have to go now, will finish tomorrow or you can edit the question with the final passage as an exercise )

Three Diag
la source
I could not obtain what I wanted exactly because of the possibility of n1n2
An old man in the sea.
I will show later if you can't get it. Hint: compute the variance of the sample mean of Z and use that as the variable in the theorem
Three Diag
Three, could you please add the details for when n1n2? Thanks
An old man in the sea.
Will do as soon as find a little timr. There was in fact a subtlety that prevents from using LL clt without adjustment. There are three ways to go, the simplest of which is invoking the fact that for large n1 and n2, X1 and X2 go in distribution to normals, then a linear combination of normal is also normal. This is a property of normals that you can take as given, otherwise you can prove it by characteristic functions.
Three Diag
The other two require either a different clt (Lyapunov possibly) or alternatively treat n1 = i and n2= i +k. Then for large i you can essentially disregard k and you can go back to apply LL (but still it will require some care to nail the right variance)
Three Diag