Le test

12

Je viens de lire dans un magazine scientifique (populaire) plutôt bien respecté (le PM allemand, 02/2013, p.36) sur une expérience intéressante (sans source, malheureusement). Cela a attiré mon attention parce que je doutais intuitivement de la signification du résultat, mais les informations fournies étaient suffisantes pour reproduire le test statistique.

Les chercheurs se sont demandé si le froid par temps froid augmentait les chances d'attraper un rhume. Ils ont donc divisé au hasard un groupe de 180 élèves en deux groupes. Un groupe a dû tenir ses pieds dans l'eau froide pendant 20 minutes. L'autre a gardé ses chaussures. Une sorte de manipulation amusante, je pense, mais d'un autre côté je ne suis pas médecin et peut-être que les médecins pensent drôle. Les questions éthiques mises à part.

Quoi qu'il en soit, après 5 jours, 13 des étudiants du groupe de traitement ont eu un rhume, mais seulement 5 du groupe qui ont gardé leurs chaussures. Le rapport de cotes de cette expérience est donc de 2,87.

Étant donné la taille plutôt petite de l'échantillon, j'ai commencé à me demander si cette différence pouvait être significative. J'ai donc effectué deux tests.

D'abord un simple test d'égalité des proportions en utilisant l'approximation normale. Ce test a avec p = 0,0468 . Je suppose que c'est ce que les chercheurs ont testé. C'est vraiment juste significatif. Cependant, ce test z n'est valable que dans de grands échantillons, si je ne me trompe pas, en raison de l'approximation normale. De plus, les taux de prévalence sont plutôt faibles et je me demande si cela ne peut pas affecter le taux de couverture de l'intervalle de confiance de l'effet.z=1.988p=0.0468

Mon deuxième essai a donc été un test d'indépendance du chi carré, à la fois avec la simulation Monte-Carlo et le chi carré Pearson standard. Ici, je trouve des valeurs de propos de p = 0,082 .p=.082

Maintenant, ce n'est pas si rassurant sur les résultats. Je me suis demandé s'il y avait plus d'options pour tester ces données et ce que vous pensez des deux tests (en particulier les hypothèses du premier test significatif)

tomka
la source
Je crois que vous avez effectué une correction de continuité sur la statistique du chi carré de Pearson, qui tient compte de l'écart dans les valeurs de p.
Scortchi - Réintégrer Monica

Réponses:

13

J'utiliserais un test de permutation au lieu de l'approximation normale ou du chi carré. Le test de permutation est exact et le plus puissant, conditionnel aux données.

Dans ce cas, nous ne pouvons pas calculer toutes les permutations des groupes, mais nous pouvons générer beaucoup de permutations aléatoires des données et obtenir une valeur assez précise:

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

ce qui indiquerait une valeur de p de 0,039.

CEPENDANT, et c'est un gros problème cependant, je suppose que l'hypothèse selon laquelle les sujets atteints de rhume sont des événements indépendants est violée. Ces personnes sont des étudiants, vraisemblablement dans la même école. Imaginez que deux d'entre eux partagent une classe, un dortoir, une autre activité ou une cafétéria (dans une école avec plusieurs cafétérias); les événements «# 1 obtient un rhume» et «# 2 obtient un rhume» ne sont pas indépendants. Je pourrais imaginer qu'un étudiant dirait "inscrivons-nous à cette expérience!" à son colocataire ou à ses amis; Je pouvais imaginer que les étudiants étaient recrutés dans les classes que les professeurs enseignaient; Je pourrais imaginer de nombreuses façons que l'hypothèse d'indépendance est violée. Peut-être que le document, que je n'ai pas lu, aborde certains d'entre eux, mais il est difficile de voir comment il pourrait les aborder tous,

jbowman
la source
Merci @jbowman - en plus vous avez effectué un test unilatéral, je vois. Je pense que cela a plus de sens que les tests bilatéraux que j'ai utilisés. Si l'approximation normale est effectuée d'un côté, les valeurs de p sont 0,023 au-dessus. J'aime le poit sur l'indépendance. Les étudiants n'étaient probablement pas non plus isolés lorsqu'ils tenaient les pieds dans l'eau, c'est donc aussi un moyen de transmettre un rhume.
tomka
(+1) Mais il convient de noter que vous n'avez pas besoin de simuler: la distribution de votre statistique de test suit une distribution hypergéométrique sous l'hypothèse nulle (& conditionnant sur les totaux marginaux). Ceci est le test exact de Fisher.
Scortchi - Réintégrer Monica
11

zχ2

z

zzt

tzz

N91×91=1,729N=180z

χ2

χ2χ2zχ2χ2zz

zχ2

gung - Réintégrer Monica
la source
Merci @gung, j'apprécie vraiment vos efforts. Cela rend les choses plus claires.
tomka
@gung je suis confus - le chi carré et le z sont-ils les mêmes ou non? stats.stackexchange.com/questions/173415/…
Xavier Bourret Sicotte
@XavierBourretSicotte, le z-test est souvent implémenté sous le capot comme un test chi carré, R le fait par exemple. Je préfère encore souvent utiliser le z-test parce que l'information est présentée d'une manière cohérente avec la compréhension qu'une variable est une covariable et l'autre est la réponse.
gung - Rétablir Monica
1
(+1) @XavierBourretSicotte: Il existe deux tests z couramment utilisés pour la différence entre deux proportions: l'un est un test de score, équivalent au test du chi carré de Pearson (dans lequel la variance du dénominateur est calculée sous le meilleur ajustement nul); l'autre est un test de Wald (dans lequel la variance du dénominateur est calculée à l'estimation de la probabilité maximale de la différence dans les deux proportions).
Scortchi - Réintégrer Monica
@Scortchi merci d'avoir clarifié cela! C'est la première fois que je tombe sur une explication aussi explicite de la différence - seriez-vous en mesure de faire le lien avec des endroits où les deux approches sont expliquées? Avec les formules correspondantes pour la variance?
Xavier Bourret Sicotte