(Pour rendre nos notions un peu plus précises, appelons la «statistique de test» la distribution de la chose que nous recherchons pour réellement calculer la valeur de p. Cela signifie que pour un test t bilatéral, notre statistique de test serait plutôt que T. )| T|T
Ce qu'une statistique de test fait est d'induire un ordre sur l'espace échantillon (ou plus strictement, un ordre partiel), afin que vous puissiez identifier les cas extrêmes (les plus cohérents avec l'alternative).
Dans le cas du test exact de Fisher, il y a déjà un ordre dans un sens - ce sont les probabilités des différentes tables 2x2 elles-mêmes. En l'occurrence, elles correspondent à l'ordre sur en ce sens que les valeurs les plus grandes ou les plus petites de sont «extrêmes» et ce sont aussi celles avec la plus faible probabilité. Donc, plutôt que de regarder les valeurs de de la manière que vous suggérez, on peut simplement travailler à partir des extrémités grandes et petites, à chaque étape en ajoutant simplement la valeur (la plus grande ou la plus petiteX1 , 1X1 , 1 X 1 , 1 X 1 , 1X1 , 1X1 , 1-valeur pas déjà là) a la plus petite probabilité qui lui est associée, continue jusqu'à ce que vous atteigniez votre table observée; lors de son inclusion, la probabilité totale de tous ces tableaux extrêmes est la valeur de p.
Voici un exemple:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
La première colonne valeurs , la deuxième colonne les probabilités et la troisième colonne l'ordre ordonné.X1 , 1
Ainsi, dans le cas particulier du test exact de Fisher, la probabilité de chaque table (de manière équivalente, de chaque valeur ) peut être considérée comme la statistique de test réelleX1 , 1 .
Si vous comparez la statistique de test suggérée, elle induit le même ordre dans ce cas (et je crois que c'est le cas en général, mais je n'ai pas vérifié), en ce que les valeurs plus élevées de cette statistique sont les valeurs plus petites de la probabilité, de sorte qu'elle pourrait également être considérée comme «la statistique» - mais il en est de même pour de nombreuses autres quantités - en effet, toutes celles qui préservent cet ordre des s dans tous les cas sont des statistiques de test équivalentes, car elles produisent toujours des valeurs de p identiques.| X1 , 1- μ |X 1 , 1X1 , 1
Notez également qu'avec la notion plus précise de «statistique de test» introduite au début, aucune des statistiques de test possibles pour ce problème n'a en fait une distribution hypergéométrique; fait, mais ce n'est pas en fait une statistique de test appropriée pour le test bilatéral (si nous faisions un test unilatéral où seule une association plus importante dans la diagonale principale et non dans la deuxième diagonale était considérée comme cohérente avec la alternative, ce serait une statistique de test). C'est exactement le même problème unilatéral / bilatéral avec lequel j'ai commencé.X1 , 1
[Edit: certains programmes présentent une statistique de test pour le test de Fisher; Je suppose que ce serait un calcul de type -2logL qui serait asymptotiquement comparable à un chi carré. Certains peuvent également présenter le rapport de cotes ou son journal, mais ce n'est pas tout à fait équivalent.]
Si vous le faites correctement et fixez les marges à des valeurs connues, vous pouvez considérer (ou toute autre cellule) comme votre statistique. Avec l'analogie de dessiner boules dans une urne contenant boules blanches et boules noires sans remplacement, peut être interprété comme le nombre de boules blanches tirées, où est la somme de la première rangée, est la somme de la deuxième ligne, est la somme de la première colonne. k W B X 1 , 1 B W kX1,1 k W B X1,1 B W k
la source
Il n'en a pas vraiment. Les statistiques de test sont une anomalie historique - la seule raison pour laquelle nous avons une statistique de test est d'obtenir une valeur p. Le test exact de Fisher dépasse une statistique de test et passe directement à une valeur de p.
la source