La procédure SPSS t-Test rapporte 2 analyses lors de la comparaison de 2 moyennes indépendantes, une analyse avec des variances égales supposées et une avec des variances égales non supposées. Les degrés de liberté (df) lorsque des variances égales sont supposées sont toujours des valeurs entières (et égales n-2). Les df lorsque des variances égales ne sont pas supposées sont non entiers (par exemple, 11,467) et loin de n-2. Je cherche une explication de la logique et de la méthode utilisées pour calculer ces df non entiers.
15
Réponses:
On peut montrer que le Welch-Satterthwaite df est une moyenne harmonique pondérée à l'échelle des deux degrés de liberté, avec des poids proportionnels aux écarts-types correspondants.
L'expression originale se lit comme suit:
Notez que est la variance estimée de la i ème moyenne de l'échantillon ou le carré de la i- ème erreur standard de la moyenne . Soit r = r 1 / r 2 (le rapport des variances estimées des moyennes de l'échantillon), doncrje= s2je/ nje jee je r=r1/r2
Le deuxième facteur est une moyenne harmonique pondérée :
-
Avec un test t à variance égale, si les hypothèses se vérifient, le carré du dénominateur est une constante multipliée par une variable aléatoire khi carré.
Le carré du dénominateur du test t de Welch n'est pas (un temps constant) un chi carré; cependant, ce n'est souvent pas une trop mauvaise approximation. Une discussion pertinente peut être trouvée ici .
Une dérivation plus de style manuel peut être trouvée ici .
la source
la source