Je lis des erreurs de décision dans les tests d'hypothèses. Ma question est la suivante: pourquoi une "erreur de type II" est-elle considérée comme une erreur? D'après ce que je comprends, elle survient lorsque nous ne parvenons pas à rejeter une fausse hypothèse nulle. Lorsque nous échouons à rejeter l'hypothèse nulle, cela signifie simplement que nous n'avons pas de preuves solides pour la rejeter. Nous ne faisons aucun commentaire sur laquelle des deux hypothèses est vraie (ou fausse) - l'une ou l'autre peut être vraie. Nous ne disons pas que l'hypothèse nulle est vraie. Par conséquent, pourquoi une telle conclusion est-elle appelée erreur?
la source
La façon dont nous voulons utiliser le mot «erreur» est en fin de compte une question sémantique et des personnes raisonnables pourraient être en désaccord sur le point de savoir si, et dans quel sens, nous devrions considérer un faux négatif comme une erreur .
la source
Le mot «échec» est proche de «erreur».
Pour moi, le terme erreur a du sens, car vous pouvez calculer une probabilité qu'il se produise (à condition de définir une certaine taille d'effet minimale qu'il serait souhaitable de détecter). Et vous voulez calculer cette probabilité dans les situations où vous voulez qu'elle soit petite. Dans ces situations, l'échec serait considéré comme une erreur.
Pour moi, c'est très symétrique avec les erreurs de type I.
Comme les valeurs de p, qui se rapportent à une erreur de type I, vous pouvez également calculer la probabilité pour (faussement) de ne pas rejeter l'hypothèse nulle. Pour une taille d'effet donnée et un test donné (par exemple, le nombre de mesures), vous pouvez calculer avec quelle probabilité cette «défaillance» pourrait se produire.
Ces pensées ne nécessitent que vous définissez une limite pour l'hypothèse nulle.
La tendance à ne pas considérer les erreurs de type II, ou du moins à fournir les limites de la taille de l'effet qui auraient pu être détectées avec une probabilité suffisante, est grande dans un monde scientifique obsédé par les valeurs de p, la signification et les tests d'hypothèse (l'inverse se produit également en mettant l'accent sur les effets mineurs qui se sont avérés importants, uniquement par un grand nombre de mesures). Sip est plus grand que certains α alors l'effet est dit / considéré comme non présent (ou plus élégamment non montré comme étant présent). De toute façon , il influence certainement nos actions futures comme si nous acceptons laH0 .
la source