Comme le dit la question - Est-il possible de prouver l'hypothèse nulle? D'après ma compréhension (limitée) de l'hypothèse, la réponse est non, mais je ne peux pas en donner une explication rigoureuse. La question a-t-elle une réponse définitive?
hypothesis-testing
proof
equivalence
Pulkit Sinha
la source
la source
Réponses:
Si vous parlez du monde réel et non de la logique formelle, la réponse est bien sûr. La "preuve" de tout par des moyens empiriques dépend de la force de l’inférence que l’on peut faire, qui est elle-même déterminée par la validité du processus de test évalué à la lumière de tout ce que l’on sait sur le fonctionnement du monde (c.-à-d. La théorie). Chaque fois que l’on accepte que certains résultats empiriques justifient de rejeter l’hypothèse "nulle", on doit nécessairement porter des jugements de ce type (validité du design; le monde fonctionne d’une certaine manière), ce qui oblige à faire les suppositions analogues nécessaires pour justifier la déduction de la "preuve de la null "n'est pas problématique du tout.
Alors, quelles sont les hypothèses analogues? Voici un exemple de "prouver le nul" qui est banal en sciences de la santé et en sciences sociales. (1) Définissez «nul» ou «aucun effet» d’une manière qui ait un sens pratique. Disons que je crois que je devrais me conduire comme s'il n'y avait pas de différence significative entre 2 traitements, t1 et t2, pour une maladie à moins que l'un ne donne 3% de meilleures chances de guérison que l'autre. (2) Déterminez une conception valide pour vérifier s'il y a un effet - dans ce cas, s'il existe une différence de probabilité de récupération entre t1 et t2. (3) Faites une analyse de puissance pour déterminer si la taille de l'échantillon est nécessaire pour générer une probabilité suffisamment élevée - une probabilité sur laquelle je suis confiant, compte tenu de quoi 'en supposant qu'il existe. Habituellement, les gens disent que le pouvoir est suffisant si la probabilité d’observer un effet spécifié à un alpha spécifié est d’au moins 0,80, mais le niveau de confiance adéquat dépend en réalité de votre opposition à l’erreur - la même chose lorsque vous sélectionnez p -seuil de valeur pour "rejeter le zéro." (4) Effectuez le test empirique et observez l'effet. Si elle est inférieure à la valeur de "différence significative" spécifiée - 3% dans mon exemple - vous avez "prouvé" qu'il n'y a "pas d'effet".
Pour un bon traitement de cette question, voir Streiner, DL Unicorns Do Exist: un tutoriel sur la «démonstration» de l'hypothèse nulle . Canadian Journal of Psychiatry 48, 756-761 (2003).
la source
Réponse du côté mathématique: il est possible si et seulement si "les hypothèses sont singulières".
Si par "prouver" vous voulez dire avoir une règle qui peut "accepter" (devrais-je dire cela :)) avec une probabilité de faire une erreur nulle, alors vous recherchez ce que l'on pourrait appeler le "test idéal" et ceci existe:H0
Si vous testez wether une variable aléatoire est tirée de P 0 ou de P 1 (c. -à- test H 0 : X ⇝ P 0 contre H 1 : X ⇝ P 1 ) alors il existe un test idéal si et seulement si P 1 ⊥ P 0 ( P 1 et P 0 sont "singuliers").X P0 P1 H0: X⇝ P0 H1: X⇝ P1 P1⊥ P0 P1 P0
Si vous ne savez pas ce que "mutuellement singulier" signifie, je peux vous donner un exemple: et U [ 3 , 4 ] (uniformes sur [ 0 , 1 ] et [ 3 , 4 ] ) sont mutuellement singuliers. . Cela signifie que si vous voulez testerU[ 0 , 1 ] U[ 3 , 4 ] [ 0 , 1 ] [ 3 , 4 ]
par rapport à H 1 : X ⇝ U [ 3 , 4 ]H0: X⇝ U[ 0 , 1 ] H1: X⇝ U[ 3 , 4 ]
alors il existe un test idéal (devinez ce que c'est :)): un test qui ne trompe jamais!
Si et P 0 ne sont pas singuliers, cela n'existe pas (cela résulte du "seulement si partie")!P1 P0
En termes non mathématiques, cela signifie que vous pouvez prouver le zéro si et seulement si la preuve est déjà dans vos hypothèses (c'est-à-dire si et seulement si vous avez choisi l'hypothèse et H 1 si différentes qu'une seule observation de H 0 ne peut pas être identifié comme appartenant à H 1 et vice versa).H0 H1 H0 H1
la source
Oui, il y a une réponse définitive. La réponse est: non, il n'y a pas moyen de prouver une hypothèse nulle. Autant que je sache, le mieux que vous puissiez faire est de jeter des intervalles de confiance autour de votre estimation et de démontrer que l'effet est si faible qu'il pourrait tout aussi bien être pratiquement inexistant.
la source
Pour moi, le cadre théorique de la décision présente le moyen le plus simple de comprendre "l'hypothèse nulle". Il dit essentiellement qu'il doit y avoir au moins deux alternatives: l'hypothèse Null et au moins une alternative. Ensuite, le "problème de décision" consiste à accepter l'une des solutions de rechange et à rejeter les autres (bien que nous devions préciser ce que nous entendons par "accepter" et "rejeter" l'hypothèse). Je vois la question de "pouvons-nous prouver l'hypothèse nulle?" comme analogue à "pouvons-nous toujours prendre la bonne décision?". Du point de vue de la théorie de la décision, la réponse est clairement oui si
1) il n’ya pas d’incertitude dans le processus de décision, car c’est un exercice mathématique de déterminer quelle est la bonne décision.
2) nous acceptons tous les autres postulats / hypothèses du problème. La plus critique (je pense) est que les hypothèses entre lesquelles nous décidons sont exhaustives et que l’une (et la seule) d’entre elles doit être vraie et les autres fausses.
D'un point de vue plus philosophique, il n'est pas possible de "prouver" quoi que ce soit, en ce sens que la "preuve" dépend entièrement des hypothèses / axiomes qui mènent à cette "preuve". Je considère la preuve comme une sorte d’équivalence logique plutôt que comme un "fait" ou une "vérité" en ce sens que si la preuve est fausse, les hypothèses qui l’ont conduit sont également fausses.
En appliquant ceci à "prouver l'hypothèse nulle", je peux "prouver" sa véracité en supposant simplement que c'est vrai ou en supposant que ce soit vrai si certaines conditions sont remplies (comme la valeur d'une statistique).
la source
Oui, il est possible de prouver le null - dans le même sens qu'il est possible de prouver une alternative au néant. Dans une analyse bayésienne, il est parfaitement possible que les probabilités en faveur du nul par rapport à l’une quelconque des alternatives proposées lui soient arbitrairement grandes. De plus, il est faux d'affirmer, comme certaines des réponses ci-dessus, que l'on ne peut prouver le nul que si ses alternatives sont disjointes (ne se chevauchent pas avec le nul). Dans une analyse bayésienne, chaque hypothèse a une distribution de probabilité antérieure. Cette distribution répartit une masse unitaire de probabilité a priori sur les alternatives proposées. L'hypothèse nulle met toute la probabilité a priori sur une seule alternative. En principe, les alternatives à null peuvent affecter toute la probabilité antérieure à une alternative non nulle (sur un autre "point"), mais c'est rare. En général, les alternatives couvrent, c'est-à-dire qu'elles étalent la même masse de probabilité antérieure que d'autres alternatives - soit à l'exclusion de l'alternative nulle, soit, plus communément, de l'alternative nulle. La question devient alors de savoir quelle hypothèse met la probabilité la plus ancienne où les données expérimentales tombent. Si les données sont proches des valeurs nulles, alors ce sera la faveur des chances (parmi les hypothèses proposées) MÊME SI CELA EST INCLUS DANS (NIDIMÉ, NON MUTUELLEMENT EXCLUSIF AVEC), LES ALTERNATIVES. L'idée selon laquelle il n'est pas possible qu'une alternative imbriquée soit plus probable que l'ensemble dans lequel elle est imbriquée reflète l'échec de la distinction entre probabilité et vraisemblance. S'il est impossible pour un composant d'un ensemble d'être moins probable que l'ensemble, il est parfaitement possible que la probabilité postérieure d'un composant d'un ensemble d'hypothèses soit supérieure à la probabilité postérieure de l'ensemble dans son ensemble. La vraisemblance postérieure d'une hypothèse est le produit de la fonction de vraisemblance et de la distribution de probabilité antérieure que propose l'hypothèse. Si une hypothèse place toute la probabilité antérieure au bon endroit (par exemple, sur le zéro), elle aura alors une probabilité postérieure supérieure à celle d'une hypothèse qui met une partie de la probabilité antérieure au mauvais endroit (et non sur le zéro). La vraisemblance postérieure d'une hypothèse est le produit de la fonction de vraisemblance et de la distribution de probabilité antérieure que propose l'hypothèse. Si une hypothèse place toute la probabilité antérieure au bon endroit (par exemple, sur le zéro), elle aura alors une probabilité postérieure supérieure à celle d'une hypothèse qui met une partie de la probabilité antérieure au mauvais endroit (et non sur le zéro). La vraisemblance postérieure d'une hypothèse est le produit de la fonction de vraisemblance et de la distribution de probabilité antérieure que propose l'hypothèse. Si une hypothèse place toute la probabilité antérieure au bon endroit (par exemple, sur le zéro), elle aura alors une probabilité postérieure supérieure à celle d'une hypothèse qui met une partie de la probabilité antérieure au mauvais endroit (et non sur le zéro).
la source
Techniquement, non, une hypothèse nulle ne peut être prouvée. Pour toute taille d’échantillon fixe et finie, il y aura toujours une taille d’effet faible mais non nulle pour laquelle votre test statistique n’a pratiquement aucune puissance. Plus concrètement, cependant, vous pouvez prouver que vous êtes dans les limites de l'hypothèse nulle, de sorte que des écarts inférieurs à cet epsilon ne sont pratiquement pas significatifs.
la source
Il y a un cas où une preuve est possible. Supposons que vous avez une école et que votre hypothèse nulle est que le nombre de garçons et de filles est égal. Au fur et à mesure que la taille de l'échantillon augmente, l'incertitude du ratio garçons / filles tend à diminuer, pour atteindre éventuellement la certitude (c'est ce que vous voulez dire par preuve) lorsque l'ensemble de la population des élèves est échantillonné.
Mais si vous n'avez pas une population finie, ou si vous échantillonnez avec remplacement et ne pouvez pas localiser les individus ré-échantillonnés, vous ne pouvez pas réduire l'incertitude à zéro avec un échantillon fini.
la source
Je voudrais aborder ici un point sur lequel beaucoup d'utilisateurs sont un peu confus. Quelle est la véritable signification de l'énoncé d'hypothèse nulle H0: p = 0? Essayons-nous de déterminer si le paramètre p est égal à zéro? Bien sûr que non, il n'y a aucun moyen d'atteindre un tel objectif.
Ce que nous avons l’intention d’établir, c’est que, compte tenu de l’ensemble de données, la valeur du paramètre évalué est (ou non) indiscernable à partir de zéro. Rappelez-vous que NHST est "injuste" par rapport aux hypothèses alternatives: le zéro correspond à un niveau de confiance de 95% et seulement 5% à l’alternative. En conséquence, un résultat «non significatif» ne signifie pas que H0 est valable, mais simplement que nous n'avons pas trouvé de preuves suffisantes de la vraisemblance de la solution de remplacement.
la source