Pourquoi les noms d'erreur de type 1, 2?

21

Quelle est la motivation de l'introduction d'un niveau supplémentaire d'indirection du «faux positif» descriptif à l'entier «1»? Le «faux positif» est-il vraiment trop long?

Vorac
la source
10
Je suis avec toi, c'est un nom affreux. J'en profite pour ne pas l'utiliser.
Matthew Drury
5
Même. Je n'ai jamais pu me souvenir de ce qui était, jusqu'à ce que j'entende cette façon incroyablement utile de les différencier ... Dans l'histoire Le garçon qui a pleuré le loup , les villageois font d' abord une erreur de type 1 , et la deuxième fois une erreur de type 2 .
Sam
1
@Sam Je me souviens d'eux comme dans "La première chose qu'un chercheur fait après avoir découvert un effet est de publier." Mais dans le volet droit, il y a un lien vers une question avec 84 votes positifs sur la façon de s'en souvenir.
Vorac
Je trouve toujours "faux positif" et "faux négatif" très déroutant. En médecine, «positif» se réfère à «avoir la condition» (qui est déjà source de confusion et source de nombreuses blagues), mais quel type de test (statistique) est utilisé pour déterminer que vous avez la condition? Est positif, ayant la condition, égal à un test rejeté pour la salubrité (par exemple, tests pour les niveaux sains de certains composants, par exemple le fer dans le sang), ou est-il égal à un test H 0 non rejeté pour la maladie (par exemple, tests pour les marqueurs qui indiquent la maladie, la condition ou autre chose comme la grossesse)? H0H0
Sextus Empiricus

Réponses:

21

Grande question, m'a motivé pour Google :) Par Wikipedia (avec des modifications de mise en forme mineures):

Une erreur de type I (ou erreur du premier type) est le rejet incorrect d'une vraie hypothèse nulle.

Une erreur de type II (ou erreur du deuxième type) est l'échec du rejet d'une hypothèse fausse nulle.

Plus bas sur la page, il traite de l'étymologie:

En 1928, Jerzy Neyman (1894–1981) et Egon Pearson (1895–1980), tous deux d'éminents statisticiens, ont discuté des problèmes liés à la «décision de décider si un échantillon particulier peut être jugé comme susceptible d'avoir été tiré au hasard d'une certaine population». "...

"... dans le test d'hypothèses, deux considérations doivent être gardées à l'esprit, (1) nous devons être en mesure de réduire le risque de rejeter une hypothèse vraie à une valeur aussi faible que souhaité; (2) le test doit être conçu de telle sorte qu'il rejettera l'hypothèse testée lorsqu'elle est susceptible d'être fausse. "

H1H2

"... [et] ces erreurs seront de deux types:

  • H0
  • (II) nous ne parvenons pas à rejeter lorsque certaines hypothèses alternatives H A ou H 1 sont vraies. "H0HUNEH1

    Dans le même article, ils appellent respectivement ces deux sources d'erreur, les erreurs de type I et les erreurs de type II.

  • Il semble donc que le premier type d'erreur était basé sur les travaux originaux de Fisher sur les tests de signification. Le deuxième type d'erreur était basé sur l'extension de Neyman et Pearson des travaux de Fisher, à savoir l'introduction de l'hypothèse alternative et donc le test d'hypothèse. Voir ici pour plus de détails.

    Il apparaît que l'ordre dans lequel ces types d'erreurs ont été identifiés correspond à leur nombre, tel que donné par Neyman et Pearson.

    ilanman
    la source
    1
    Raisons historiques - sans surprise. Tout comme les <-macros de substitution de texte de R et C ++. Merci d'avoir répondu à ma question mal documentée. Et merci à @gung pour la bonne édition de questions.
    Vorac
    3
    "L'ordre dans lequel ils y ont pensé" n'était-il pas cependant fortement influencé par les travaux antérieurs de Fisher? c'est-à-dire jusqu'à ce que Neyman et Pearson introduisent l'idée d'une autre hypothèse, il n'y avait qu'un seul "type" d'erreur (rejetant H_0 quand c'est vrai). Avec H_A vient la possibilité d'une erreur "du deuxième type".
    steeldriver
    J'en suis sûr.
    ilanman
    Un petit point qu'il serait bon d'ajouter est que l'article de 1928 "Sur l'utilisation et l'interprétation de certains critères de test à des fins d'inférence statistique" ne définit pas encore les différentes sources d'erreur comme des erreurs de "type I" et de "type II". (au lieu de cela, il parle de type ordonné en ce qui concerne les distributions de Pearson). C'est en 1933 que Neyman et Pearson l'ont défini comme type I et type II.
    Sextus Empiricus
    Il serait également bon de redresser la citation avec des références correctes. Ou du moins la première citation "... pour tester les hypothèses deux considérations ..." n'est pas littéralement de l'article de 1928.
    Sextus Empiricus