Variance de la statistique

12

Le de Cohen dest l'une des façons les plus courantes de mesurer la taille d'un effet ( voir Wikipedia ). Il mesure simplement la distance entre deux moyennes en termes d'écart type groupé. Comment dériver la formule mathématique d'estimation de la variance du de Cohen d?

Édition de décembre 2015: L' idée de calculer les intervalles de confiance autour de est liée à cette question d. Cet article déclare que

σd2=n+n×+d22n+

n+ est la somme des deux tailles d'échantillon et n× est le produit des deux tailles d'échantillon.

Comment cette formule est-elle dérivée?

JRK
la source
@ Clarinettiste: Il est quelque peu controversé de modifier la question d'une autre personne pour y ajouter plus de substance et plus de questions (par opposition à l'amélioration de la formulation). J'ai pris la liberté d'approuver votre montage (étant donné que vous avez placé une généreuse prime et que je pense que votre montage améliore la question), mais d'autres pourraient décider de revenir en arrière.
amibe dit Réintégrer Monica
1
@amoeba Pas de problème. Tant que la formule est là pour (qui n'existait pas auparavant) et qu'il est clair que nous recherchons une dérivation mathématique de la formule, c'est bien. σd2
Clarinettiste
Je pense que le dénominateur de la deuxième fraction devrait être . Voir ma réponse ci-dessous. 2(n+2)

Réponses:

15

Notez que l'expression de la variance dans la question est une approximation. Hedges (1981) a dérivé la grande variance de l'échantillon de et l'approximation dans un cadre général (c'est-à-dire plusieurs expériences / études), et ma réponse passe en revue les dérivations dans l'article.d

Tout d'abord, les hypothèses que nous utiliserons sont les suivantes:

Supposons que nous avons deux groupes de traitement indépendants, (traitement) et C (contrôle). Soit Y T i et Y C j les scores / réponses / quoi que ce soit du sujet i dans le groupe T et du sujet j dans le groupe C , respectivement.TCYTiYCjiTjC

Nous supposons que les réponses sont normalement distribuées et que les groupes de traitement et de contrôle partagent une variance commune, c.-à-d.

YTiN(μT,σ2),i=1,nTYCjN(μC,σ2),j=1,nC

La taille de l'effet que nous souhaitons estimer dans chaque étude est . L'estimateur de la taille d'effet que nous utiliserons est d= ˉ Y T- ˉ Y Cδ=μTμCσS2kest la variance d'échantillon sans biais pour le groupek.

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2
Sk2k

Examinons les propriétés à grand échantillon de . d

Tout d'abord, notez que: et (étant lâche avec ma notation): ( n T - 1 ) S 2 T

Y¯TY¯CN(μTμC,σ2nT+nCnTnC)
et (nC-1)S 2 C
(1)(nT1)ST2σ2(nT+nC2)=1nT+nC2(nT1)ST2σ21nT+nC2χnT12
(2)(nC1)SC2σ2(nT+nC2)=1nT+nC2(nC1)SC2σ21nT+nC2χnC12

1σ2(nT1)ST2+(nC1)SC2nT+nC21nT+nC2χnT+nC22

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2=(σnT+nCnTnC)1(Y¯TY¯C)(σnT+nCnTnC)1(nT1)ST2+(nC1)SC2nT+nC2=(Y¯TY¯C)(μTμC)σnT+nCnTnC+μTμCσnT+nCnTnC(nT+nCnTnC)1(nT1)ST2+(nC1)SC2σ2(nT+nC2)=nT+nCnTnC(θ+δnTnCnT+nCVν)
θN(0,1)Vχν2ν=nT+nC2dnT+nCnTnCnT+nC2δnTnCnT+nC

t

(3)Var(d)=(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2b2
b=Γ(nT+nC22)nT+nC22Γ(nT+nC32)134(nT+nC2)1

δbd

Vuner(b)=b2(nT+nC-2)(nT+nC-4)(nT+nC)nTnC(1+δ2nTnCnT+nC)-δ2

nT+nC-2tνp1+p22ν

Vuner()nT+nCnTnC(1+δ2(nTnCnT+nC)2(nT+nC-2))=nT+nCnTnC+δ22(nT+nC-2)

δ


la source
Oui¯jeT-Oui¯jeCb
@ Clarinettiste Merci! 1) Comment peuvent-ils avoir le même indice? Typo, c'est comme ça! : P Ils sont un artefact de mon premier projet de réponse. Je vais arranger ça. 2) Je l'ai retiré du papier Hedges - je ne connais pas sa dérivation pour le moment mais j'y penserai un peu plus.
bΓ(nT+nC-22)
Dérivation fournie à titre de référence: math.stackexchange.com/questions/1564587/… . Il s'avère qu'il y a probablement une erreur de signe.
Clarinettiste
@mike: réponse très impressionnante. Merci d'avoir pris le temps de la partager avec nous.
Denis Cousineau