D'abord une notation. Soit et la séquence catégorielle associée à et , c'est-à-dire . Soit . Considérez les binerisations
où est le Delta de Kronecker. Nous avons donc{Xt}1,…,m{Yt}1,…,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m
X∗iY∗i=(X∗1,i,…,X∗N,i)=(δi,X1,…,δi,Xn,0,…,0)=(Y∗1,i,…,Y∗N,i)=(0,…,0,δi,Y1,…,δi,Yn)
δi,j≡1i=jXm,i=∑t=1NX∗t,i=∑t=1mδi,XtYn,i=∑t=1NY∗t,i=∑t=1nδi,Yt
Nous commençons maintenant la preuve. Nous combinons d'abord les deux sommets de la statistique de test. Notez que
Nous pouvons donc écrire la statistique de test comme
Xm,i−mc^iYn,i−nc^i=(n+m)Xm,i−m(Xm,i+Yn,i)n+m=nXm,i−mYn,in+m=(n+m)Yn,i−n(Xm,i+Yn,i)n+m=mYn,i−nXm,in+m
S=∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i=∑i=1k(nXm,i−mYn,i)2(n+m)2mc^i+∑i=1k(nXm,i−mYn,i)2(n+m)2nc^i=∑i=1k(nXm,i−mYn,i)2nm(n+m)c^i
Notez ensuite que
avec le propriétés suivantes
nXm,i−mYn,i=∑t=1NnX∗t,i−mY∗t,i=Zi
E[Zi]Var[Zi]Cov[Zi,Zj]=nE[Xm,i]−mE[Yn,i]=nmai−nmai=0=Var[nXm,i−mYn,i]=n2Var[Xm,i]−m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1−ai)+m2nai(1−ai)=nm(n+m)ai(1−ai)=E[ZiZj]−E[Zi]E[Zj]=E[(nXm,i−mYn,i)(nXm,j−mYn,j)]=n2(−maiaj+m2aiaj)−2n2m2aiaj+m2(−naiaj+n2aiaj)=−nm(n+m)aiaj
et donc par CLT multivarié, nous avons où le e élément de , . Puisque Par Slutsky, nous avons où est la matrice d'identité ,
1nm(n+m)−−−−−−−−−√Z=nXm−mYnnm(n+m)−−−−−−−−−√→DN(0,Σ)
(i,j)Σσij=ai(δij−aj)c^=(c^1,…,c^k)→p(a1,…,ak)=anXm−mYnnm(n+m)−−−−−−−−−√c^→DN(0,Ik−a−−√a−−√′)
Ikk×ka−−√=(a1−−√,…,ak−−√) . Puisque a la valeur propre 0 de multiplicité 1 et la valeur propre 1 de multiplicité , par le théorème de mappage continu (ou voir Lemme 17.1, Théorème 17.2 de van der Vaart) nous avons
Ik−a−−√a−−√′k−1∑i=1k(nXm,i−mYn,i)2nm(n+m)c^i→Dχ2k−1