Dans de nombreux endroits, j'ai lu que nous ne pouvons jamais dire que nous "acceptons" l'hypothèse nulle. Au lieu de cela, nous devons dire que nous «échouons à rejeter» l'hypothèse nulle.
Mais je ne vois pas comment cela concorde avec cet exemple simple: supposons que nous testons un médicament qui est censé guérir complètement le diabète dans les 24 heures. Nous l'essayons sur 1000 patients, et tous souffrent toujours de diabète après avoir pris le médicament.
N'est-il pas évident que ce médicament ne guérit pas le diabète? c'est-à-dire que nous acceptons l'hypothèse nulle?
Je ne ferais certainement pas confiance à ce médicament.
Hypothèse nulle: le médicament n'a aucun effet sur les patients.
Hypothèse alternative: le médicament guérit le diabète
la source
Réponses:
Première possibilité: le médicament a un effet très faible. Peut-être qu'il guérit .0001% des personnes qui le prennent. Le test que vous avez décrit implique seulement qu'il n'y a pas suffisamment de preuves pour l'alternative dramatique que vous avez proposée.
Deuxième possibilité: le médicament a un effet négatif très fort. (crédit à @ssdecontrol) Peut-être que le médicament n'a aucun effet et que tous ces patients se seraient améliorés par eux-mêmes, mais grâce au médicament, aucun des patients ne s'est rétabli.
Sans aucune connaissance préalable, les données seraient compatibles avec ces possibilités ainsi qu'avec la possibilité que la valeur null soit vraie.
Donc, ne pas rejeter le null n'implique pas que le null soit plus vrai que ces autres possibilités.
la source
Il y a de bonnes réponses ici, mais ce qui, à mon avis, est la question clé n'est explicitement mentionné nulle part. En bref, votre formulation des hypothèses nulles et alternatives n'est pas valide. Les hypothèses nulles et alternatives doivent être mutuellement exclusives (c'est-à-dire qu'elles ne peuvent pas être toutes les deux vraies). Votre formulation répond à ce critère. Cependant, ils doivent également être collectivement exhaustifs (c'est-à-dire que l'un d'eux doit être vrai). Votre formulation ne répond pas à ce critère.
Vous ne pouvez pas avoir une hypothèse nulle selon laquelle le médicament a chances de guérir le diabète et une autre hypothèse selon laquelle le médicament a chances de guérir le diabète. Imaginez que la vraie probabilité que le médicament guérisse le diabète est de , alors vos hypothèses nulles et alternatives sont fausses. Voilà votre problème.0% 100% 50%
L'hypothèse nulle prototypique est une valeur ponctuelle (par exemple, sur la droite du nombre réel, ou le plus souvent en se référant aux probabilités, mais ce ne sont que des conventions). De plus, si vous travaillez avec un espace de paramètres borné (comme vous êtes ici - les probabilités doivent être comprises entre ), il est généralement problématique d'essayer de tester des valeurs qui sont aux limites (c.-à-d. ou ). Après avoir choisi une valeur en points comme valeur nulle (la valeur que vous souhaitez rejeter), vous pouvez obtenir des preuves contre elle, mais vous ne pouvez pas obtenir de preuves à partir de vos données (cf. la réponse perspicace de @ John ). Pour mieux comprendre cela, il peut vous être utile de lire ma réponse ici:0 50% [0, 1] 0 1 Pourquoi les statisticiens disent-ils qu'un résultat non significatif signifie «vous ne pouvez pas rejeter le nul» au lieu d'accepter l'hypothèse nulle? Pour appliquer ces idées à votre situation plus concrètement, même si votre valeur nulle était (et donc votre hypothèse alternative était ), et que vous aviez essayé le médicament sur patients sans qu'un seul soit guéri, vous ne pouviez pas accepter votre hypothèse nulle: les données seraient toujours cohérentes avec la possibilité que la probabilité soit de (voir: Comment dire la probabilité d'échec s'il n'y avait pas d'échecs? ). 0% π≠0 100,000 0.00003
En revanche, vous n'avez pas besoin d'avoir un point nul. Les hypothèses nulles (c'est-à-dire ) ne sont pas des points, par exemple. Ce sont des ensembles de points infinis. De même, vous pouvez également avoir une hypothèse de plage / intervalle (par exemple, que le paramètre est dans ). Dans ce cas, vous pouvez accepter votre nullité sur la base des preuves - c'est à cela que sert le test d'équivalence. (Vous pouvez toujours faire une erreur de type I, bien sûr.)<θ0 [a, b]
la source
Comme l'ont commenté les autres utilisateurs, le problème avec l'acceptation de l'hypothèse nulle est que nous n'avons pas assez de preuves (et nous ne le ferons jamais) pour conclure que l'effet est exactement 0. Mathématiquement, le test d'hypothèse n'est généralement pas capable de répondre à de telles questions .
Cependant, cela ne signifie pas que l'intention de votre question n'est pas valable! En fait, c'est généralement l'intention des essais cliniques pour les médicaments génériques: l'objectif n'est pas de montrer que vous avez produit un médicament plus efficace, mais plutôt que votre médicament est essentiellement aussi efficace que la marque de commerce (et vous pouvez produire à un coût beaucoup plus faible). L'équivalence est généralement considérée comme l'hypothèse nulle.
Pour répondre à cette question à l'aide de tests d'hypothèse, la question est reformée de manière à pouvoir y répondre. La question reformatée ressemble à ceci:
où est l'effet du générique et est l'effet du médicament d'origine. Alors maintenant, si nous rejetons l'hypothèse nulle, nous pouvons conclure que le générique est au moins 75% aussi efficace que la marque de nom. De toute évidence, ce n'est pas la même chose que de dire exactement équivalent, mais cela revient à la question qui vous intéresse (et d'une manière qui, selon moi, est une question mathématiquement plus raisonnable).β n bβg βnb
Nous pouvons aborder votre question de manière similaire. Plutôt que d'essayer de dire "avons-nous suffisamment de preuves pour conclure à 0 effet?", Nous pouvons demander "étant donné nos preuves, quel est l'effet maximum pour lequel nos résultats n'étaient pas trop inhabituels?". Avec et 0 succès, on peut affirmer que nous avons suffisamment de preuves pour conclure que la probabilité de succès est inférieure à 0,3% (selon le test exact de Fisher, ).α = 0,05n=1000 α=0.05
De ce résultat, vous pouvez sûrement toujours conclure que ce n'est pas un médicament auquel vous aurez confiance.
la source
Supposons que le médicament fonctionne, mais seulement sur 0,00001% de la population. La drogue fonctionne, point final. Quelles sont les chances de détecter, statistiquement, que cela fonctionne sur un échantillon de 10000 personnes? 100 000 personnes? 1 000 000 de personnes?
la source
Il est incorrect de dire que vous ne pouvez jamais accepter l'hypothèse nulle. Vous sortez les informations du manuel de leur contexte. Ce que vous ne pouvez pas faire, c'est utiliser un test d'hypothèse nulle pour l'accepter. Le test consiste à rejeter l'hypothèse. Notez que votre propre argument pour accepter a peu à voir avec un résultat de test. Il s'agit des données. Il serait plutôt insensé d'exécuter un test dans votre exemple. Vous pouvez utiliser vos données pour affirmer que vous acceptez l'hypothèse nulle. Il n'y a rien de mal à cela. Vous ne pouvez tout simplement pas utiliser les résultats du test pour le faire.
La raison pour laquelle vous ne pouvez pas utiliser un test d'hypothèse seul est parce qu'il n'est pas conçu pour cela. Si vous ne comprenez pas cela à partir des manuels, c'est compréhensible. C'est en fait un paradoxe intéressant que la valeur p ne signifie réellement quelque chose que si la valeur null est vraie mais ne peut pas être utilisée pour démontrer que la valeur null est vraie. Pour le rendre plus simple, considérez peut-être la sensibilité à la puissance. Vous pouvez toujours collecter bien trop peu d'échantillons et ne pas rejeter la valeur nulle. Comme vous pouvez le faire, il est clair que le test seul n'est pas une raison valable pour accepter le null. Mais encore une fois, cela ne signifie pas que vous ne pouvez jamais dire que la valeur null est vraie. Cela signifie seulement que le test n'est pas un fondement pour affirmer que la valeur null est vraie.
REMARQUE : Il existe un argument de rasoir d'Occam selon lequel vous devez accepter la valeur null lorsque vous ne rejetez pas; mais le test ne vous dit pas d'accepter le null. Ce que vous faites est d'accepter le null comme valeur par défaut et si vous ne refusez pas avec le test, vous conservez l'état par défaut. Donc, même dans ce cas, la valeur nulle n'est pas acceptée en raison du test.
la source
À travers vos commentaires, je pense que cette question vous intéresse beaucoup: pourquoi pouvons-nous accumuler suffisamment de preuves pour rejeter la nullité , mais pas l' alternative , c'est-à-dire ce qui fait que l'hypothèse teste une rue à sens unique?
La chose très importante à penser est de savoir quelles valeurs constituent l'hypothèse nulle? Dans votre exemple, il ne s'agit que d'une seule valeur, -à- . À l'inverse, l'alternative est . p = 0 p > 0i.e. p=0 p>0
Nous acceptons l'une ou l'autre hypothèse si toutes les "valeurs raisonnables" (c'est-à-dire les valeurs à l'intérieur de notre intervalle de confiance) tombent complètement dans la plage donnée par cette hypothèse. Donc, si toutes nos valeurs raisonnables sont supérieures à 0, nous accepterions l'alternative. En revanche, l'hypothèse nulle n'est qu'un seul point, 0! Donc, pour accepter la valeur nulle, nous devons avoir un intervalle de confiance de longueur 0 . Étant donné que (généralement parlant) l'intervalle de confiance de longueur s'approche de 0 comme , mais n'atteint pas la longueur 0 pour fini , nous aurions besoin de collecter une quantité infinie de données pour conclure que nous n'avons aucune marge d'erreur dans notre estimation.nn→∞ n
Mais notez que si nous définissons l'hypothèse nulle comme étant plus qu'un simple point, c'est-à-dire un test d'hypothèse unilatéral tel que
En fait , nous pouvons accepter l'hypothèse nulle. Supposons que notre intervalle de confiance soit (0,35, 0,45). Toutes ces valeurs inférieures ou égales à 0,5, ce qui est voisin de l'hypothèse nulle. Donc, dans ce cas, nous pourrions accepter le null.
Petit, technique, abus de statistiques note: si on veut vraiment abuser de la théorie asymptotique, on pourrait (mais ne devrait pas ...) accepter le nul dans votre exemple: l'erreur standard asymptotique est . Votre intervalle de confiance asymptotique sera donc (0,0), qui appartient tous à l'hypothèse nulle. Mais cela ne fait qu'abuser des résultats asymptotiques; notez que vous obtenez la même conclusion même si = 1.n(p^(1−p^)/n)−−−−−−−−−−√=0 n
la source
Je sais que vous avez affaire à une hypothèse nulle, mais le vrai problème est l'exemple donné ou comme indiqué l'exemple simple. 1 000 personnes reçoivent un médicament et cela ne fonctionne pas. Quelles autres maladies ces gens avaient-ils, quels étaient leur âge et leur stade de maladie. Pour déclarer une hypothèse nulle plus d'informations; probablement détaillé; doit être donnée pour faire ce travail dans un cadre scientifique.
la source