Pourquoi les erreurs de type II ne sont-elles pas autant soulignées dans la littérature statistique?

10

J'ai vu de nombreux cas où des erreurs de type I sont prises en compte (désignées par une valeur alpha) dans divers articles de recherche. J'ai trouvé rare qu'un chercheur prenne en considération la puissance ou l'erreur de type II.

Les erreurs de type II peuvent être un gros problème, non? Nous avons accidentellement rejeté l'hypothèse alternative alors qu'elle était en réalité fausse. Pourquoi les valeurs alpha sont-elles tellement mises en évidence au lieu des valeurs bêta?

Quand j'ai pris des statistiques de première année, je n'ai jamais appris la bêta, seulement l'alpha. J'estime que ces deux erreurs devraient être traitées également. Pourtant, seul l'alpha semble être souligné.


la source
1
+1 La raison est que traditionnellement, l'erreur de type I (aka, ou le niveau de signification ) est fixée en premier, puis le test est construit de manière à minimiser l'erreur de type II (de manière équivalente, par exemple pour maximiser la puissance) . Un article utile sur wikipedia pour comprendre le problème est celui sur les tests UMP (Uniformly Most Powerful), en.wikipedia.org/wiki/Uniformly_most_powerful_testα
Jeremias K
3
Vous vous trompez sur "nous avons accepté l'hypothèse nulle" - nous ne l' acceptons jamais . Soit nous «rejetons null hyp», soit «nous refusons de rejeter null hyp», mais nous n'acceptons jamais null hyp!
homme des cavernes
foudroyé - qui me survolait. Merci d'avoir fait remarquer cela.
1
Veillez à ne pas confondre votre propre expérience avec l'ensemble du domaine de la littérature statistique; vous pouvez à peine déduire le contenu de matériel que vous n'avez pas lu.
Glen_b -Reinstate Monica
@glen tout de suite. Un titre savy obtient plus de réponses.

Réponses:

5

C'est une bonne question. Permettez-moi de commencer par quelques clarifications:


Je pense que vous avez (malheureusement) raison de prêter moins d'attention aux erreurs d'alimentation et de type II. Bien que je pense que la situation s'améliore dans la recherche biomédicale (par exemple, les agences de financement et les IRB exigent souvent des analyses de puissance maintenant), je pense qu'il y a plusieurs raisons à cela:

  1. Je pense que le pouvoir est plus difficile à comprendre que la simple signification. (C'est en partie parce que cela dépend de beaucoup d'inconnues - notamment la taille de l'effet, mais il y en a aussi d'autres).
  2. 0
  3. Les scientifiques ont traditionnellement supposé que les erreurs de type I étaient pires que les erreurs de type II.
gung - Réintégrer Monica
la source
1
Comme toujours, éclairant - surtout pour les non-mathématisés :-) ... J'adore cette formulation ... Je me demande si vous pourriez développer un peu le troisième point ... Y a-t-il une base pour ce biais. Je sais que c'est vrai, mais pourquoi pensez-vous que c'est le cas ... Est-ce parce qu'il s'agit du trophée de la valeur p, et rien d'autre n'a d'importance?
Antoni Parellada
Merci, @AntoniParellada. Je vais réfléchir à ce que je pourrais ajouter de plus.
gung - Rétablir Monica
2
Je voudrais clarifier le point 3) pourquoi les scientifiques pensent que les erreurs de type I sont pires. L'hypothèse nulle est généralement une sorte de "statu quo", par exemple, l'effet de ce tout nouveau médicament est 0. Nous aimons le statu quo, et le fardeau de la preuve incombe au chercheur de prouver le contraire. Ainsi, nous voulons limiter les erreurs de type I, c'est-à-dire que nous rejetons à tort le statu quo. OMI, cet attachement au statu quo est juste philosophique. Si vous voulez changer mon opinion, vous devrez le prouver.
Heisenberg
1
En pratique, on pourrait facilement penser à des cas où l'erreur de type II importe beaucoup plus, c'est-à-dire que le coût de la non-rejet de la valeur nulle est élevé. Par exemple, si l'humanité est confrontée à une épidémie de zombies, je suis sûr que l'attitude serait «d'essayer n'importe quel médicament même s'il ne fonctionne pas» plutôt que «vous devez prouver qu'il fonctionne avant de l'utiliser».
Heisenberg
Ajout à @Heisenberg: Dans les cas où les erreurs de type II sont les plus importantes, il faut envisager de basculer entre les tests d'hypothèse ponctuelle et le test d'équivalence. Dans votre exemple, il faudrait prouver qu'une sauce worcester proposée au moins n'aggrave pas l'épidémie de zombies. Ensuite, les taux d'erreur changent de rôle et le taux d'erreur le plus important est à nouveau fixé par conception. De plus, si vous avez une estimation des coûts des mauvaises décisions, il faut envisager une règle de décision qui minimise les risques et ne fixe pas (nécessairement) un taux d'erreur de type I.
Horst Grünbusch
2

La raison en est que nous ne connaissons tout simplement pas le taux d'erreur réel de type II et nous ne le saurons jamais. Cela dépend d'un paramètre que nous ne connaissons généralement pas. À son tour, si nous connaissions ce paramètre, nous n'aurions pas besoin de faire un test statistique.

Cependant, nous pouvons planifier une expérience de telle sorte qu'un taux d'erreur spécifique de type II soit atteint, étant donné qu'une alternative est vraie. De cette façon, nous choisirions une taille d'échantillon qui ne gaspille pas les ressources: soit parce que le test ne rejette pas à la fin, soit parce que déjà une taille d'échantillon beaucoup plus petite aurait suffi pour rejeter l'hypothèse.

Horst Grünbusch
la source