Explication des degrés de liberté non entiers dans le test t avec des variances inégales

15

La procédure SPSS t-Test rapporte 2 analyses lors de la comparaison de 2 moyennes indépendantes, une analyse avec des variances égales supposées et une avec des variances égales non supposées. Les degrés de liberté (df) lorsque des variances égales sont supposées sont toujours des valeurs entières (et égales n-2). Les df lorsque des variances égales ne sont pas supposées sont non entiers (par exemple, 11,467) et loin de n-2. Je cherche une explication de la logique et de la méthode utilisées pour calculer ces df non entiers.

Joel W.
la source
3
Une présentation PowerPoint de l'Université de Floride contient un bon compte rendu de la façon dont cette approximation de la distribution d'échantillonnage de la statistique de Student t est calculée pour le cas de variances inégales.
whuber
Le test t de Welch est-il toujours plus précis? Y a-t-il un inconvénient à utiliser l'approche Welch?
Joel W.
Si le Welch et le test t d'origine produisent des p radicalement différents, avec quoi devrais-je aller? Que faire si la valeur de p pour les différences de variances n'est que de 0,06, mais que les différences dans les valeurs de p des deux tests t sont de 000 et de 121? (Cela s'est produit lorsqu'un groupe de 2 n'avait aucune variance et l'autre groupe de 25 avait une variance de 70 000.)
Joel W.
2
Ne choisissez pas entre eux sur la base de la valeur . À moins d'avoir une bonne raison (avant même de voir les données) de supposer une variance égale, ne faites tout simplement pas cette hypothèse. p
Glen_b -Reinstate Monica
1
Les questions portent toutes sur le moment d'utiliser le test Welch. Cette question a été publiée sur stats.stackexchange.com/questions/116610/…
Joel W.

Réponses:

11

On peut montrer que le Welch-Satterthwaite df est une moyenne harmonique pondérée à l'échelle des deux degrés de liberté, avec des poids proportionnels aux écarts-types correspondants.

L'expression originale se lit comme suit:

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

Notez que est la variance estimée de la i ème moyenne de l'échantillon ou le carré de la i- ème erreur standard de la moyenne . Soit r = r 1 / r 2 (le rapport des variances estimées des moyennes de l'échantillon), doncrje=sje2/njejeejer=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

1+sech(log(r))1r=02r=11r=logr

Le deuxième facteur est une moyenne harmonique pondérée :

H(x_)=i=1nwii=1nwixi.

wi=ri2

r1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

Avec un test t à variance égale, si les hypothèses se vérifient, le carré du dénominateur est une constante multipliée par une variable aléatoire khi carré.

Le carré du dénominateur du test t de Welch n'est pas (un temps constant) un chi carré; cependant, ce n'est souvent pas une trop mauvaise approximation. Une discussion pertinente peut être trouvée ici .

Une dérivation plus de style manuel peut être trouvée ici .

Glen_b -Reinstate Monica
la source
1
Grand aperçu de la moyenne harmonique, qui est plus appropriée que la moyenne arithmétique pour les rapports de moyenne.
Felipe G.Nievinski
10

ttttts12/n1s22/n2; if the larger n is associated with a sufficiently smaller variance, the combined df can be lower than the larger of the two df.) The WS correction finds the right proportion of way from the former to the latter to adjust the df. Then the test statistic is assessed against a t-distribution with that df.

gung - Reinstate Monica
la source
For one t-test, SPSS reports the df as 26.608 but the n's for the two groups are 22 and 104. Are you sure about " The appropriate df must be somewhere between the full df and the df of the larger group"? (The standard deviations are 10.5 and 8.1 for the smaller and larger groups, respectively.)
Joel W.
2
It depends on the relative sizes of s12/n1 vs s22/n2. If the larger n is associated with a sufficiently larger variance, the combined d.f. can be lower than the larger of the two d.f. Note that the Welch t-test is only approximate, since the squared denominator is not actually a (scaled) chi-square random variate. However in practice it does quite well.
Glen_b -Reinstate Monica
I think I'll expand on the relationship between the relative sizes of the (si2/ni) and the Welch d.f. in an answer (since it won't fit in a comment).
Glen_b -Reinstate Monica
1
@Glen_b, I'm sure that will be of great value here.
gung - Reinstate Monica