Signalement des degrés de liberté pour le test t de Welch

14

Le test t de Welch pour les variances inégales (également connu sous le nom de Welch-Satterthwaite ou Welch-Aspin) a généralement un degré de liberté non entier . Comment citer ces degrés de liberté lors de la communication des résultats du test?

"Il est classique d'arrondir à l'entier le plus proche avant de consulter les tables t standard" selon diverses sources * - ce qui est logique car cette direction d'arrondi est conservatrice. ** Certains logiciels statistiques plus anciens le feraient aussi (par exemple Graphpad Prism avant la version 6 ) et certaines calculatrices en ligne le font toujours. Si cette procédure avait été utilisée, la communication des degrés de liberté arrondis semble appropriée. (Bien que l'utilisation d'un meilleur logiciel puisse être encore plus appropriée!)

Mais la grande majorité des packages modernes utilisent la partie fractionnaire, dans ce cas, il semble que la partie fractionnaire devrait être citée. Je ne vois pas qu'il soit approprié de citer à plus de deux décimales, car un millième de degré de liberté n'aurait qu'un impact négligeable sur la valeur p .

En regardant autour de Google scholar, je peux voir des articles citant le df comme un nombre entier, avec une décimale ou avec deux décimales. Existe-t-il des directives sur la précision à utiliser? En outre, si le logiciel utilisé la pleine partie décimale, si la cité df arrondi vers le bas au nombre désiré de chiffres (par exemple à ou 1 PD comme un nombre entier) comme cela a été approprié à la calcul conservateur, ou comme cela me semble plus sensé, arrondi conventionnellement ( au plus près ) de sorte que à 1 dp ou à l'entier le plus proche?77.5845...7.5787.5845...7.68

Edit: en plus de connaître la manière la plus saine théoriquement de signaler un df non entier, il serait également bon de savoir ce que les gens font dans la pratique . Vraisemblablement, les revues et les guides de style ont leurs propres exigences. Je serais curieux de savoir ce qu'exigent des guides de style influents comme l'APA. D'après ce que je peux discerner (leur manuel n'est pas disponible gratuitement en ligne), l'APA a une préférence générale que presque tout devrait apparaître à deux décimales, à l'exception des valeurs de p (qui peuvent être deux ou trois dp) et des pourcentages (arrondis à la pourcentage le plus proche) - qui couvre les pentes de régression, les statistiques t, les statistiques F ,χ2statistiques et ainsi de suite. Ceci est assez illogique, sachant que la deuxième décimale occupe un chiffre significatif très différent, et suggère une précision assez différente, en 2,47 qu'en 982,47, mais pourrait expliquer le nombre de Welch df avec deux décimales que j'ai vu dans mon échantillon non scientifique .

par exemple Ruxton, GD Le test t de variance inégale est une alternative sous-utilisée au test t de Student et au test Mann-Whitney U , Behavioral Ecology (juillet / août 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016

Bien que l'approximation de Welch-Satterthwaite elle-même puisse ou non être conservatrice, et dans un cas où elle ne l'est pas, arrondir les degrés de liberté n'est pas une garantie de compensation globale.

Silverfish
la source
1
Je n'ai pas étudié la pratique réelle - c'est pourquoi il s'agit d'un commentaire et non d'une réponse - mais je m'attends à ce qu'elle soit basée sur un jugement lié à la communication de chiffres significatifs. Pour un df relativement élevé, souvent un changement dans la première décimale ne changerait pas du tout la valeur de p (au niveau de précision rapporté), donc l'arrondi à un entier est très bien. Pour df très faible et des valeurs extrêmes de , la dérivéepeut dépasser , ce qui suggère dans de tels cas que ne doit être rapporté qu'à un seul chiffre moins significatif que lui-même. t | νt0,01νp|νFν(t)|0.01νp
whuber
@whuber C'est en effet une observation utile, en particulier lorsqu'elle est combinée avec la réponse de Glen_b. Quelle est la valeur «très faible» pour ? (Je soupçonne, d'après l'échantillon d'articles que j'ai rencontré, qu'une grande partie de la «pratique réelle» n'est peut-être pas la même chose qu'une «bonne pratique»! Je soupçonne que le suivi robotique des lignes directrices a autant d'effet que le jugement, c'est pourquoi il serait intéressant pour savoir quelles sont les consignes de déclaration courantes.)ν
Silverfish

Réponses:

10

Je n'ai pas étudié la pratique réelle, donc cette réponse ne peut pas aborder cet aspect de la question. En tant que principe général, je m'attends à ce que le traitement des chiffres significatifs dans la déclaration des degrés de liberté (df) soit basé sur un jugement lié à des chiffres significatifs.

Le principe est d' être cohérent : utiliser la précision d'une quantité appropriée à la précision utilisée dans une autre qui lui est liée. Plus précisément, lors de la déclaration des valeurs et y = f ( x ) lorsque x est donné au multiple le plus proche d'une petite valeur h (telle que h = 1xy=f(x)xhpour six positions après la virgule), la précision relative enymédiée par la fonctionfesth=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

L'approximation s'applique lorsque est différenciable en continu sur l'intervalle .[ x - h , x + h ]f[xh,x+h]

Dans la présente demande, est la valeur , est le degré de liberté , etp x νypxν

y=f(x)=f(ν)=Fν(t)

où est la statistique de Welch-Satterthwaite et est le CDF de la distribution de Student avec degrés de liberté.F ν t νtFνtν

Pour un df relativement élevé , souvent un changement à la première décimale ne changerait pas du tout la valeur de p (au niveau de précision rapporté), donc l'arrondi à un entier est très bien ( mais est très petit). Pour de très faibles df et des valeurs extrêmes de la statistique , la magnitude de la dérivéepeut dépasser , ce qui suggère dans de tels cas que ne doit être signalé qu'à une décimale de moins que lui-même.h = une / deux h | νh=1/2t| h|ddxf(x)|t0,01νp|νFν(t)|0.01νp

Voyez par vous-même avec ce tracé de contour étiqueté de la magnitude de la dérivée pour le plus bas (raisonnable) df et les plages dece serait intéressant (car ils peuvent conduire à de faibles valeurs de p).|t|

Figure

Les étiquettes montrent le logarithme en base 10 du dérivé. Ainsi, aux points compris entre et sur ce graphique, la modification du df rapporté à la place après la virgule décimale ne modifiera probablement la valeur p rapportée que dans la et emplacements ultérieurs. Par exemple, supposons que vous arrondissez la valeur de p à (six décimales). Considérez les statistiques et . Ils sont situés près du contour de log . Par conséquent, doit être signalé à décimales.k(k+1)jth(j+k)th106ν=2.5t=83ν6+(3)=3

Les zones bleu clair, pour le plus grand , sont celles qui sont préoccupantes, car elles montrent où les petits changements de ont les plus grands effets sur la valeur de p.kν

Comparez cela à la situation pour un df plus élevé (de à illustré):430

Figure 2

L'influence de sur la précision de diminue rapidement à mesure que augmente.νpν

whuber
la source
1
Ce fut une contribution très utile pour établir par quels principes il faut arrondir les degrés de liberté (+50!); J'espère qu'un répondeur ultérieur pourra combler les lacunes concernant la pratique réelle.
Silverfish
7

Il est classique d'arrondir à l'entier le plus proche avant de consulter les tables t standard

La raison de cette convention est que les tables n'ont pas de df non entier. Il n'y a aucune raison de le faire autrement.

ce qui est logique car cet ajustement est conservateur.

Eh bien, la statistique n'a pas de distribution t, car le dénominateur carré n'a pas de distribution chi carré. C'est une approximation qui peut ou non être conservatrice dans un cas particulier - l'arrondi de df vers le bas peut ne pas être certain d'être conservateur lorsque nous considérons la distribution exacte de la statistique dans un cas particulier.

(par interpolation ou en réduisant réellement les nombres pour la distribution t avec ce df?)

Les valeurs de p des distributions t (en appliquant le cdf à une statistique t) peuvent être calculées par une variété d'approximations assez précises, de sorte qu'elles sont effectivement calculées plutôt qu'interpolées.

Je ne vois pas qu'il soit approprié de citer plus de deux décimales

Je suis d'accord.

Existe-t-il des directives sur la précision à utiliser?

Une possibilité pourrait être d'étudier la précision de l'approximation de Welch-Satterthwaite pour la valeur de p dans cette région générale des rapports de variance et de ne pas citer une exactitude relative beaucoup plus grande que celle suggérée dans le df (en gardant à l'esprit que le df sur le le chi carré dans le carré du dénominateur donne juste une approximation à quelque chose qui n'est pas chi carré de toute façon).

Glen_b -Reinstate Monica
la source
1
J'aurais dû préciser que «l'arrondi est conservateur». L'approximation de Welch-Satterthwaite elle-même peut être conservatrice ou non. Mais le processus d'arrondi est certainement - si l'approximation n'était pas conservatrice au départ, elle est au moins moins mauvaise après l'arrondi. En revanche, l'arrondi (par exemple "7,5845 tours le plus proche de 8") n'est certainement pas un ajustement conservateur. Je pourrais faire pour trouver une meilleure façon d'exprimer cela, mais j'espère que mon point est clair!
Silverfish
"Une possibilité pourrait être d'étudier la précision de l'approximation de Welch-Satterthwaite pour la valeur de p dans cette région générale des rapports de variance" - ceci est très sensible et semble être l'approche fondée sur des principes. Est-ce quelque chose de commun? Quelques conseils pour la mise en œuvre seraient bien. Dans la pratique, je soupçonne que les directives de style journal ont souvent le dernier mot sur la question! Mais je ne sais pas ce qu'ils disent - il y avait certainement une variété de pratique dans les journaux que ma recherche a révélés.
Silverfish
Afin d'éviter toute confusion aux futurs lecteurs, j'ai tenté de clarifier les arrondis conservateurs dans le corps de la question. Merci d'avoir récupéré ça.
Silverfish
Je ne pense pas que quelque chose comme cela soit fait couramment, mais je ne pense pas que cela signifie que cela ne devrait pas l'être. La quantité d'explication de la raison pour laquelle un tour / tronque jusqu'à un certain point pénètre dans le document dépendra clairement du journal / éditeur / arbitres.
Glen_b -Reinstate Monica