Je viens de lire dans un magazine scientifique (populaire) plutôt bien respecté (le PM allemand, 02/2013, p.36) sur une expérience intéressante (sans source, malheureusement). Cela a attiré mon attention parce que je doutais intuitivement de la signification du résultat, mais les informations fournies étaient suffisantes pour reproduire le test statistique.
Les chercheurs se sont demandé si le froid par temps froid augmentait les chances d'attraper un rhume. Ils ont donc divisé au hasard un groupe de 180 élèves en deux groupes. Un groupe a dû tenir ses pieds dans l'eau froide pendant 20 minutes. L'autre a gardé ses chaussures. Une sorte de manipulation amusante, je pense, mais d'un autre côté je ne suis pas médecin et peut-être que les médecins pensent drôle. Les questions éthiques mises à part.
Quoi qu'il en soit, après 5 jours, 13 des étudiants du groupe de traitement ont eu un rhume, mais seulement 5 du groupe qui ont gardé leurs chaussures. Le rapport de cotes de cette expérience est donc de 2,87.
Étant donné la taille plutôt petite de l'échantillon, j'ai commencé à me demander si cette différence pouvait être significative. J'ai donc effectué deux tests.
D'abord un simple test d'égalité des proportions en utilisant l'approximation normale. Ce test a avec p = 0,0468 . Je suppose que c'est ce que les chercheurs ont testé. C'est vraiment juste significatif. Cependant, ce test z n'est valable que dans de grands échantillons, si je ne me trompe pas, en raison de l'approximation normale. De plus, les taux de prévalence sont plutôt faibles et je me demande si cela ne peut pas affecter le taux de couverture de l'intervalle de confiance de l'effet.
Mon deuxième essai a donc été un test d'indépendance du chi carré, à la fois avec la simulation Monte-Carlo et le chi carré Pearson standard. Ici, je trouve des valeurs de propos de p = 0,082 .
Maintenant, ce n'est pas si rassurant sur les résultats. Je me suis demandé s'il y avait plus d'options pour tester ces données et ce que vous pensez des deux tests (en particulier les hypothèses du premier test significatif)
Réponses:
J'utiliserais un test de permutation au lieu de l'approximation normale ou du chi carré. Le test de permutation est exact et le plus puissant, conditionnel aux données.
Dans ce cas, nous ne pouvons pas calculer toutes les permutations des groupes, mais nous pouvons générer beaucoup de permutations aléatoires des données et obtenir une valeur assez précise:
ce qui indiquerait une valeur de p de 0,039.
CEPENDANT, et c'est un gros problème cependant, je suppose que l'hypothèse selon laquelle les sujets atteints de rhume sont des événements indépendants est violée. Ces personnes sont des étudiants, vraisemblablement dans la même école. Imaginez que deux d'entre eux partagent une classe, un dortoir, une autre activité ou une cafétéria (dans une école avec plusieurs cafétérias); les événements «# 1 obtient un rhume» et «# 2 obtient un rhume» ne sont pas indépendants. Je pourrais imaginer qu'un étudiant dirait "inscrivons-nous à cette expérience!" à son colocataire ou à ses amis; Je pouvais imaginer que les étudiants étaient recrutés dans les classes que les professeurs enseignaient; Je pourrais imaginer de nombreuses façons que l'hypothèse d'indépendance est violée. Peut-être que le document, que je n'ai pas lu, aborde certains d'entre eux, mais il est difficile de voir comment il pourrait les aborder tous,
la source
la source