Étant donné que le logiciel peut maintenant calculer le test exact de Fisher si facilement de nos jours , existe-t-il des circonstances dans lesquelles, théoriquement ou pratiquement, le test du khi-carré est réellement préférable au test exact de Fisher?
Les avantages du test exact de Fisher incluent:
- mise à l'échelle pour des tables de contingence supérieures à 2x2 (c'est-à-dire n'importe quelle table r x c )
- donne une valeur p exacte
- ne pas avoir besoin d'avoir un nombre de cellules minimum attendu pour être valide
Réponses:
De R-help, 2009 :
... la dernière édition du livre d'Armitage recommande que les ajustements de continuité ne soient jamais utilisés pour les tests du khi-deux dans les tableaux de contingence;
Modification E. Pearson du test du chi-carré de Pearson, différant de l'original d'un facteur (N-1) / N;
Cochran a noté que le nombre 5 dans "fréquence attendue inférieure à 5" était arbitraire;
les résultats des études publiées peuvent être résumés comme suit , pour des essais comparatifs:
Le test du chi-carré de Yate a des taux d'erreur de type I inférieurs à la valeur nominale, souvent inférieurs à la moitié de la valeur nominale;
Le test Fisher-Irwin présente des taux d'erreur de type I inférieurs à la valeur nominale;
La version de K Pearson du test du chi-carré a des taux d'erreur de type I plus proches du test nominal que le test du chi-carré de Yate et le test de Fisher-Irwin, mais dans certaines situations, les erreurs de type I sont sensiblement plus grandes que la valeur nominale;
Le test du chi carré «N-1» se comporte comme la version «N» de K. Pearson, mais la tendance aux valeurs supérieures à la valeur nominale est réduite;
Le test bilatéral Fisher-Irwin utilisant la règle d'Irwin est moins conservateur que la méthode qui double la probabilité unilatérale;
Le test à mi-parcours de Fisher-Irwin, en doublant la probabilité unilatérale, donne de meilleurs résultats que les versions standard du test Fisher-Irwin, et la méthode des médiums selon la règle d'Irwin fonctionne encore mieux en ayant des erreurs de type I plus proches des niveaux nominaux. ";
soutien important pour le test «N-1» à condition que les fréquences attendues soient supérieures à 1;
défaut dans le test de Fisher fondé sur le postulat de Fisher selon lequel les totaux marginaux ne contiennent aucune information utile;
démonstration de leurs informations utiles dans des échantillons de très petite taille;
L'ajustement de la continuité de N / 2 par Yate constitue une correction excessive et est inapproprié;
des contre-arguments existent pour l'utilisation de tests de randomisation dans des essais randomisés;
calculs des pires cas;
recommandation générale : utilisez le test du chi-carré «N-1» lorsque toutes les fréquences attendues sont au moins égal à 1; sinon, utilisez le test de Fisher-Irwin selon la règle d'Irwin pour les tests bilatéraux, en prenant des tables de l'une ou de l'autre extrémité comme probables ou moins, comme cela observé; voir la lettre d'Antonio Andres au rédacteur en chef et la réponse de l'auteur en 27: 1791-1796; 2008.
... premier article à vraiment quantifier le caractère prudent du test de Fisher;
"la taille de l’essai du FET était inférieure à 0,035 pour presque toutes les tailles d’échantillons avant 50 et n’approchait pas de 0,05 même pour des tailles d’échantillons supérieures à 100.";
conservativité des méthodes "exactes";
voir Stat in Med 28 : 173-179, 2009 pour une critique sans réponse
valeur des tests inconditionnels;
voir la lettre à l'éditeur 30: 890-891; 2011
la source
c'est une excellente question.
Le test exact de Fisher est l'un des bons exemples de l'utilisation intelligente du plan expérimental par Fisher , ainsi que du conditionnement des données (essentiellement des tableaux avec les totaux des lignes observés et marginaux) et de son ingéniosité pour trouver des distributions de probabilité (bien que ce ne soit pas le meilleur exemple , pour un meilleur exemple, voir ici ). L'utilisation d'ordinateurs pour calculer des valeurs p "exactes" a certainement permis d'obtenir des réponses précises.
Cependant, il est difficile de justifier les hypothèses du test exact de Fisher dans la pratique. Parce que le prétendu "exact" vient du fait que dans "l'expérience de dégustation de thé" ou dans le cas des tableaux de contingence 2x2, le total des lignes et le total des colonnes, c'est-à-dire que les totaux marginaux sont fixés par conception. Cette hypothèse est rarement justifiée dans la pratique. Pour de bonnes références, voir ici .
Le nom "exact" amène à croire que les valeurs p données par ce test sont exactes, ce qui, malheureusement, est malheureusement toujours incorrect pour la plupart des cas, pour ces raisons.
Dans la plupart des cas pratiques, l'utilisation d'un test du rapport de vraisemblance ou d'un test du chi carré ne devrait pas donner de réponses très différentes (valeur p) du test exact de Fisher. Oui, lorsque les marginaux sont fixes, le test exact de Fisher est un meilleur choix, mais cela se produira rarement. Par conséquent, l'utilisation du test du chi carré du test du rapport de vraisemblance est toujours recommandée pour les contrôles de cohérence.
Des idées similaires s’appliquent lorsque le test exact de Fisher est généralisé à n’importe quel tableau, ce qui revient en gros à calculer des prédictions hypergéométriques à plusieurs variables. Par conséquent, il faut toujours essayer de calculer les valeurs de p basées sur la distribution du rapport de probabilité et de chi carré, en plus des valeurs de p "exactes".
la source