Test de Fisher en R

11

Supposons que nous ayons l'ensemble de données suivant:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Si je lance le test exact de Fisher dans R, qu'est-ce que cela alternative = greaterimplique (ou moins)? Par exemple:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Je reçois le p-value = 0.01588et odds ratio = 3.943534. De plus, lorsque je retourne les lignes du tableau de contingence comme ceci:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

alors je reçois le p-value = 0.9967et odds ratio = 0.2535796. Mais, quand je lance deux tableaux de contingence sans autre argument (c. -à- fisher.test(mat)) je reçois le p-value = 0.02063.

  1. Pourriez-vous s'il vous plaît m'expliquer la raison?
  2. De plus, quelle est l'hypothèse nulle et l'hypothèse alternative dans les cas ci-dessus?
  3. Puis-je exécuter le test Fisher sur une table de contingence comme celle-ci:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: je ne suis pas statisticien. J'essaie d'apprendre des statistiques afin que votre aide (réponses en anglais simple) soit très appréciée.

snape
la source

Réponses:

11

greater(ou less) fait référence à un test unilatéral comparant une hypothèse nulle p1=p2à l'alternative p1>p2(ou p1<p2). En revanche, un test bilatéral compare les hypothèses nulles à l'alternative qui p1n'est pas égale à p2.

Pour votre tableau, la proportion de personnes à la diète qui sont des hommes est 1/4 = 0,25 (10 sur 40) dans votre échantillon. En revanche, la proportion de personnes non-à la diète qui sont des hommes est 1/13 ou (5 sur 65) égale à 0,077 dans l'échantillon. Ainsi, l'estimation de p1est de 0,25 et de p20,077. Il semble donc que p1>p2.

C'est pourquoi pour l'alternative unilatérale, p1>p2la valeur p est de 0,01588. (De petites valeurs de p indiquent que l'hypothèse nulle est peu probable et que l'alternative est probable.)

Lorsque l'alternative est, p1<p2nous voyons que vos données indiquent que la différence est dans la mauvaise direction (ou imprévue).

C'est pourquoi dans ce cas, la valeur de p est si élevée de 0,9967. Pour l'alternative bilatérale, la valeur p doit être un peu plus élevée que pour l'alternative unilatérale p1>p2. Et en effet, c'est avec une valeur de p égale à 0,02063.

Michael R. Chernick
la source
1
Explication fantastique. Ainsi, le test exact du pêcheur compare en fait les probabilités entre les lignes plutôt que les colonnes?
Christian
@Christian: Non, peu importe si ses lignes ou colonnes pendant que le test du pêcheur vérifie la corrélation dans un tableau de contingence. Les lignes et les colonnes n'ont pas d'importance directement. Vous pouvez également reformuler l'hypothèse: au lieu de cela, H0 étant "les personnes qui fument meurent plus jeunes", vous pouvez également supposer H0: "les personnes qui meurent plus jeunes sont plus susceptibles de fumer". Les résultats du test de Fisher vous diraient si une connexion observée dans les données prend en charge l'hypothèse nulle ou non, mais peu importe quelle est la variable indépendante ou dépendante et également le choix des lignes / colonnes n'a pas d'importance: )
Dominique Paul