Test exact de Fisher dans les tableaux de contingence supérieurs à 2x2

29

On m'a appris à appliquer uniquement le test exact de Fisher dans les tableaux de contingence qui étaient 2x2.

Des questions:

  1. Fisher lui-même a-t-il jamais envisagé que ce test soit utilisé dans des tableaux de plus de 2x2 (je suis au courant de l'histoire de lui qui a conçu le test tout en essayant de deviner si une vieille femme pouvait dire si du lait était ajouté au thé ou du thé était ajouté au lait )

  2. Stata me permet d'utiliser le test exact de Fisher sur n'importe quelle table de contingence. Est-ce valable?

  3. Est-il préférable d'utiliser le FET lorsque le nombre de cellules attendu dans un tableau de contingence est <5?

pmgjones
la source
1
Vous voudrez peut-être considérer à quel point le test exact de Fisher est vraiment bon: stat.columbia.edu/~gelman/research/published/isr.pdf (Section 3.3)
Fr.
Vous pouvez calculer le test exact de Fisher dans R. Leur méthode utilise en fait un algorithme de réseau pour le rendre assez rapide: stat.ethz.ch/R-manual/R-patched/library/stats/html/… Voir l'article [Mehta and Patel 1986]
Simone

Réponses:

20

Le seul problème avec l'application du test exact de Fisher à des tables plus grandes que 2x2 est que les calculs deviennent beaucoup plus difficiles à faire. La version 2x2 est la seule qui soit même réalisable à la main, et je doute donc que Fisher ait jamais imaginé le test dans des tableaux plus grands car les calculs auraient été au-delà de tout ce qu'il aurait envisagé.

Néanmoins, le test peut être appliqué à n'importe quelle table mxn et certains logiciels, y compris Stata et SPSS, fournissent cette fonctionnalité. Même ainsi, le calcul est souvent approximé en utilisant une approche de Monte Carlo.

Oui, si le nombre de cellules attendu est petit, il est préférable d'utiliser un test exact car le test du chi carré n'est plus une bonne approximation dans de tels cas.

Rob Hyndman
la source
Pouvez-vous m'indiquer où je peux trouver de la documentation sur la façon de faire le test Fisher à l'aide de SPSS? Merci
biostat_newbie
Regardez sous les tableaux croisés
Rob Hyndman
Étant donné que le logiciel peut faire le calcul si facilement de nos jours, y a-t-il une circonstance où, théoriquement ou pratiquement, le test du Chi au carré est en fait préférable au test exact de Fisher?
pmgjones
Dans de nombreux cas, le test "exact" n'est pas exact du tout et de nombreuses méthodes "approximatives" ont une couverture plus proche du niveau de signification nominal. Voir par exemple Alan Agresti et Brent A. Coull (1998) "Approximate Is Better than" Exact "for Interval Estimation of Binomial Proportions" The American Statistician , 52 (2): 119-126.
Maarten Buis
2
Quelle est à peu près la taille maximale du tableau de contingence qui peut être analysée avec la méthode exacte de Fisher dans un laps de temps possible (disons une semaine sur un ordinateur portable standard)?
pir
6

Cette page de MathWorld explique le fonctionnement des calculs. Il souligne que le test peut être défini de différentes manières:

Pour calculer la valeur P du test, les tableaux doivent être classés selon un critère qui mesure la dépendance, et les tableaux qui représentent un écart égal ou supérieur à l'indépendance que le tableau observé sont ceux dont les probabilités sont additionnées. Divers critères peuvent être utilisés pour mesurer la dépendance.

Je n'ai pas pu trouver d'autres articles ou textes expliquant comment cela se fait avec des tableaux supérieurs à 2x2.

Cette calculatrice calcule le test de Fisher exact pour les tableaux à 2 colonnes et jusqu'à 5 lignes. Le critère qu'il utilise est la probabilité hypergéométrique de chaque table. La valeur P globale est la somme de la probabilité hypergéométrique de toutes les tables avec les mêmes totaux marginaux dont les probabilités sont inférieures ou égales à la probabilité calculée à partir des données réelles.

Harvey Motulsky
la source
2

Afin d'obtenir le test exact de Fisher dans SPSS, utilisez l'option Statistics = Exact dans les tableaux croisés. La vitesse des microprocesseurs modernes rend le temps de calcul sans importance de nos jours. En effet, il est si facile d'exécuter le test exact qu'il est important de ne pas l'utiliser trop largement.

StatisticsDoc Consulting
la source