Pouvons-nous accepter la valeur nulle dans les tests de non-infériorité?

11

Dans un test t moyen des moyens, en utilisant les méthodes habituelles de test d'hypothèse, nous rejetons le nul ou ne le rejetons pas mais nous n'acceptons jamais le nul. Une des raisons à cela est que si nous obtenions plus de preuves, la même taille d'effet deviendrait significative.

Mais que se passe-t-il dans un test de non infériorité?

C'est:

H0:μ1μ0x

contre.

H1:μ1μ0>x

où est un montant que nous considérons comme essentiellement le même. Donc, si nous rejetons la valeur nulle, nous disons que est supérieur à d'au moins . Nous ne rejetons pas la nullité s'il n'y a pas de preuves suffisantes. μ 1 μ 0 xxμ1μ0x

Si la taille de l'effet est ou supérieure, cela est analogue au test t normal. Mais que faire si la taille de l'effet est inférieure à dans l'échantillon que nous avons? Ensuite, si nous augmentions la taille de l'échantillon et conservions le même effet, cela resterait non significatif. Pouvons-nous donc accepter la nullité dans ce cas?xxx

Peter Flom
la source
1
Vos hypothèses sont-elles mélangées? Normalement, pour un test NI, l'hypothèse nulle est que la différence est supérieure à x, alors que l'alternative est qu'elle est inférieure ou égale à x. Je suppose que cela dépend de l'ordre de votre échelle de différence.
Björn
Salut @ Björn, cela dépendra si plus haut est pire ou plus haut est meilleur.
Peter Flom
1
Est-ce la même chose que de demander si l'on peut accepter la valeur nulle dans les tests unilatéraux? Il en a été question dans les commentaires sur stats.stackexchange.com/a/85914 .
amibe
2
@amoeba Je pense que Peter présente un argument fascinant (+1), peut-être plus proche d'un paradoxe. Une explication conventionnelle de la raison pour laquelle nous n'acceptons pas H0, que l'on entend parfois, est que «si nous obtenions plus de preuves, la même taille d'effet deviendrait significative». Mais suivant cette logique comme le fait Peter, nous arrivons à la conclusion que dans certaines situations, nous devons «accepter H0», ou si nous ne le faisons pas, que la «raison» est en fait fausse, et pas pourquoi nous le faisons du tout. Je pense que vous avez raison - son argument s'appliquerait également aux tests t unilatéraux, car la taille d'un effet négatif reste insignifiante à mesure que n augmente
Silverfish
1
Oui, je suis d'accord: la réponse liée ne répond pas à votre question. Je n'ai fourni le lien que parce qu'il y avait une discussion connexe dans les commentaires.
amoeba

Réponses:

7

Votre logique s'applique exactement de la même manière aux bons vieux tests unilatéraux (c'est-à-dire avec ) qui peuvent être plus familiers aux lecteurs. Pour être concret, imaginez que nous testons le rapport à l'alternative que est positif. Ensuite, si true est négatif, l'augmentation de la taille de l'échantillon ne donnera pas de résultat significatif, c'est-à-dire que pour utiliser vos mots, il n'est pas vrai que "si nous obtenions plus de preuves, la même taille d'effet deviendrait significative".H 0 : μ 0 μ μx=0H0:μ0μμ

Si nous testons , nous pouvons avoir trois résultats possibles:H0:μ0

  1. Premièrement, intervalle de confiance peut être entièrement supérieur à zéro; alors nous rejetons le null et acceptons l'alternative (que est positif).μ(1α)100%μ

  2. Deuxièmement, l'intervalle de confiance peut être entièrement inférieur à zéro. Dans ce cas, nous ne rejetons pas le null. Cependant, dans ce cas, je pense qu'il est bon de dire que nous "acceptons le null", car nous pourrions considérer comme un autre null et rejeter celui-ci.H1

  3. Troisièmement, l'intervalle de confiance peut contenir zéro. Ensuite, nous ne pouvons pas rejeter et nous ne pouvons pas non plus rejeter , il n'y a donc rien à accepter.H 1H0H1

Je dirais donc que dans des situations unilatérales, on peut accepter le nul, oui. Mais nous ne pouvons l'accepter simplement parce que nous ne l'avons pas rejeté; il y a trois possibilités, pas deux.

(Exactement la même chose s'applique aux tests d'équivalence alias "tests bilatéraux" (TOST), tests de non-infériorité, etc. On peut rejeter le null, accepter le null ou obtenir un résultat non concluant.)

En revanche, lorsque est un point nul tel que , nous ne pouvons jamais l'accepter, car ne constitue pas une hypothèse nulle valide.H0H0:μ=0H1:μ0

(À moins que ne puisse avoir que des valeurs discrètes, par exemple doit être un entier; alors il semble que nous pourrions accepter car constitue maintenant un null valide Ceci est cependant un cas particulier.)H 0 : μ = 0 H 1μH0:μ=0H1:μZ,μ0


Cette question a été discutée il y a quelque temps dans les commentaires sous la réponse de @ gung ici: pourquoi les statisticiens disent-ils qu'un résultat non significatif signifie "vous ne pouvez pas rejeter le nul" plutôt que d'accepter l'hypothèse nulle?

Voir aussi un fil intéressant (et sous-voté) Le fait de ne pas rejeter le nul dans l'approche Neyman-Pearson signifie-t-il qu'il faut «l'accepter»? , où @Scortchi explique que dans le cadre de Neyman-Pearson, certains auteurs n'ont aucun problème à parler d '"accepter le nul". C'est aussi ce que @Alexis signifie dans le dernier paragraphe de sa réponse ici.

amibe
la source
Si l' intervalle de confiance est entièrement au-dessus de zéro, rejetez la valeur nulle qui : c'est un test avec une taille dans le pire des cas de . Si l' intervalle de confiance est entièrement inférieur à zéro, rejetez la valeur nulle qui : c'est un test avec la pire des cas de . En combinant les deux tests, vous pouvez conserver une taille dans le pire des cas de car les deux valeurs nulles s'excluent mutuellement. Ainsi, les trois résultats peuvent être décrits en termes d'acceptation d'une alternative, ou d'une autre alternative, ou de rejet ni de null. (1α)μ0α2(1α)μ>0α2α2
Scortchi - Réintégrer Monica
Un test bilatéral peut être considéré de la même manière comme composé de deux tests unilatéraux; mais les alternatives ne s'excluent pas mutuellement, et la taille la plus défavorable est (lorsque ). αμ=0
Scortchi - Réintégrer Monica
Merci @Scortchi. D'une certaine manière, je ne sais pas très bien si vous êtes d'accord ou en désaccord avec ma réponse.
amoeba
Comme n'est pas acceptée en tant que nul dans un seul test, mais en tant que solution de rechange dans un autre, je me sens « d' accepter l'hypothèse nulle » est une confusion inutile ici; néanmoins votre procédure devrait satisfaire ceux qui en ont envie. Ce qui mérite peut-être une plus grande importance dans votre réponse est la différence entre la combinaison de tests de non-infériorité et d'infériorité et vice versa , et les tests de supériorité et de non-supériorité (ou le néant nul) et d'infériorité vs la non-infériorité (ou le néant nul) . μ0
Scortchi - Réintégrer Monica
@Scortchi La syntaxe de votre dernière phrase est assez compliquée: qu'est-ce qui peut ou ne peut pas être combiné exactement et quelle est exactement la différence? Je ne suis pas sûr de vous avoir bien compris, désolé.
amoeba
6

Nous n'acceptons jamais l'hypothèse nulle (sans tenir compte également de la puissance et de la taille minimale de l'effet pertinent). Avec un seul test d'hypothèse, nous posons un état de nature, , puis répondons à une variation de la question "dans quelle mesure est-il peu probable que nous ayons observé les données sous-jacentes à notre statistique de test, en supposant (et notre distribution hypothèse) est vrai? " Nous rejetterons ou échouerons ensuite notre sur la base d'un taux d'erreur de type I préféré, et tirerons une conclusion qui concerne toujours … c'est-à-dire que nous avons trouvé des preuves pour conclure , ou nous l'avons fait pas trouvé de preuves pour conclure . Nous n'acceptons pas H 0 H 0 H A H A H A H 0H0H0H0HAHAHAH0parce que nous n'avons pas cherché de preuves pour cela. L'absence de preuve (par exemple, d'une différence), n'est pas la même chose que la preuve d'absence (par exemple, d'une différence). .

Cela est vrai pour les tests unilatéraux, tout comme pour les tests bilatéraux: nous recherchons uniquement des preuves en faveur de et les trouvons, ou ne les trouvons pas.HA

Si nous ne posons qu'un seul (sans accorder une attention sérieuse à la fois à la taille minimale de l'effet pertinent et à la puissance statistique), nous nous engageons effectivement a priori en faveur du biais de confirmation , car nous n'avons pas cherché de preuves pour , seule preuve pour . Bien sûr, nous pouvons (et, oserais-je dire, devrions ) poser des hypothèses nulles pour et contre une position ( tests de pertinence qui combinent des tests de différence ( ) avec des tests d'équivalence ( ) faites juste cela). H 0 H A H + 0 H - 0H0H0HAH0+H0

Il me semble qu'il n'y a aucune raison pour laquelle vous ne pouvez pas combiner l'inférence d'un test unilatéral d'infériorité avec un test unilatéral de non-infériorité pour fournir des preuves (ou un manque de preuves) dans les deux directions simultanément.

Bien sûr, si l'on considère la puissance et la taille de l'effet, et que l'on ne rejette pas , mais que l'on sait qu'il y a (a) une certaine taille minimale d'effet , et (b) que leurs données sont suffisamment puissantes pour détecter pour un test donné, alors on peut interpréter cela comme une preuve de . δ H 0H0δH0

Alexis
la source
1
La question de Peter contenait un point particulièrement intéressant que cette réponse semble contourner: que l'une des explications conventionnelles données de la terminologie standard "ne pas rejeter H0" est que, par exemple, dans un test t, si nous obtenons plus de preuves, le même effet la taille deviendrait significative. Mais si c'était la "vraie" raison pour laquelle nous "échouons à rejeter", son argument selon lequel nous pourrions "accepter H0" dans les circonstances qu'il décrit semble (du moins pour moi) être fort - même si je ne suis pas sûr l'ai vu faire autrement que par hasard, comme une sorte d'argot statistique, plutôt que consciemment et délibérément.
Silverfish
1
Cette réponse réaffirme la position conventionnelle sur «l'acceptation de H0» d'une manière agréable, claire et succincte, mais ne semble pas aborder directement l'argument (ou peut-être le paradoxe) au cœur de la question de Peter. Que pensez-vous de l'argument «nous ne pouvons pas accepter H0 parce que si nous obtenions plus de preuves, la même taille d'effet deviendrait significative» pour la terminologie conventionnelle - y a-t-il une faille dans la présentation ou l'extension de Peter, ou était la logique de l'argument d'origine invalide en premier lieu?
Silverfish
1
@Silverfish suivez le lien dans ma réponse aux "tests de pertinence" pour plus d'amplification de ma résolution critique au problème de "nous ne pouvons pas accepter H0 parce que si nous obtenions plus de preuves, la même taille d'effet deviendrait significative"
Alexis
1
@Alexis Je dois être d'accord avec Silverfish. J'apprécie votre réponse, mais elle ne répond pas à mon point central, pour la raison que Silverfish a énoncée. Si nous avions N = 1 000 000, alors à peu près n'importe quelle différence serait significative dans l'établissement de normes. Mais dans le cas de la non-infériorité, ce n'est pas le cas. Et même dans TOST à ​​deux faces, ce n'est pas le cas. Si la différence est inférieure au montant que nous jugeons important, alors aucun N ne le fera sig.
Peter Flom
1
Toutes mes excuses - mon premier commentaire était simplement un prélude au 2e (ou plus exactement, le 2e était le débordement du 1er!) Et n'était pas destiné à soulever un point indépendant. Le lien était utile, merci. Votre point central (que vous avez très bien expliqué, à la fois dans votre réponse et dans votre reformulation) explique clairement pourquoi vous n'êtes pas d'accord avec la conclusion de Peter . Mais j'étais curieux de savoir où vous sentiez que le défaut était dans sa logique - ou peut-être sa prémisse . C'est le morceau qui me semblait ne pas avoir été abordé directement.
Silverfish