Quelle distribution le test exact de Fisher suppose-t-il?

11

Dans mon travail, j'ai vu plusieurs utilisations du test exact de Fisher, et je me demandais dans quelle mesure il correspond à mes données. En regardant plusieurs sources, j'ai compris comment calculer la statistique, mais je n'ai jamais vu d'explication claire et formelle de l'hypothèse nulle supposée.

Quelqu'un peut-il expliquer ou me renvoyer à une explication formelle de la distribution supposée? Sera reconnaissant pour une explication en termes de valeurs dans le tableau de contingence.

Amit Lavon
la source
3
Dans le cas 2x2, il est basé sur la distribution hypergéométrique.
Glen_b -Reinstate Monica

Réponses:

11

Dans le cas , l'hypothèse de distribution est donnée par deux variables aléatoires binomiales indépendantes et . L'hypothèse nulle est l'égalité . Mais le test exact de Fisher est un test conditionnel: il repose sur la distribution conditionnelle de étant donné . Cette distribution est une distribution hypergéométrique avec un paramètre inconnu: le rapport de cotes , puis l'hypothèse nulle est .2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

Cette distribution a sa page Wikipedia .

Pour l'évaluer avec R, vous pouvez simplement utiliser la formule définissant la probabilité conditionnelle:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Ou utilisez la dnoncenhypergeomfonction du MCMCpackpackage:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838
Stéphane Laurent
la source
Merci @Stephane. Pouvez-vous expliquer davantage pourquoi elle devient hypergéométrique et quels sont les paramètres?
Amit Lavon
2
Désolé @AmitLavon, je ne connais pas les détails de cette distribution hypergéométrique.
Stéphane Laurent
1
@AmitLavon Je viens de modifier ma réponse pour inclure le lien vers wikipedia et le code R.
Stéphane Laurent
10

Le soi-disant test «exact» de Fisher fait le même genre d'hypothèses subtiles que les tests .χ2

  • Les deux variables évaluées pour l'association sont de véritables variables tout ou rien polytomiques telles que mort / vivant aux États-Unis / en Europe. Si l'une des variables ou les deux sont une simplification d'un continuum sous-jacent, une analyse catégorique des données ne devrait pas être entreprise du tout.
  • Il n'y a pas d'autres variables d'arrière-plan pertinentes. Si est la variable de résultat et est une variable en cours d'évaluation pour l'association avec , la probabilité que soit identique pour chaque sujet avec fixé à . Les tableaux de contingence supposent en effet qu'il n'y a pas d' hétérogénéité dans la distribution de qui est pas prise en compte par . Par exemple, dans un essai clinique randomisé étudiant l'effet du traitement A vs B sur la probabilité de décès, unYXYY=yXxYX2×2Le test du tableau de contention suppose que chaque sujet sous traitement A a la même probabilité de décès. [On pourrait faire valoir que cette hypothèse est trop stricte, mais cette position ne reconnaît pas la perte de pouvoir résultant de tests d'association non ajustés.]

Le test de Fisher fait une hypothèse qui n'est pas faite par des tests d'association inconditionnels tels que le Pearson : que nous nous intéressons à la distribution marginale "actuelle" de et , c'est-à-dire que nous conditionnons sur les fréquences du catégories de résultats. Ce n'est pas raisonnable pour les études prospectives. L'utilisation du test de Fisher conduit au conservatisme. Ses valeurs sont en moyenne trop grandes, car le test garantit que les valeurs ne sont pas trop petites. En moyenne, les valeurs de Pearson sont plus précises que celles de Fisher, même avec des fréquences attendues bien inférieures à 5 dans certaines cellules.χ2XYYPPχ2 P

Frank Harrell
la source
Merci @FrankHarrell. Pouvez-vous donner des références pour votre affirmation selon laquelle les valeurs P du chi carré sont plus précises que celles de Fisher?
Amit Lavon
1
Voir par exemple citeulike.org/user/harrelfe/tag/fishers-exact-test . Cela a été longuement discuté sur stackexchange.
Frank Harrell
malheureusement, ctiteulike a disparu et web.archive.org ne semble avoir exploré que la première page du compte harrelfe.
Glen_b -Reinstate Monica