Priorités bayésiennes non informatives vs hypothèses nulles fréquentistes: quelle est la relation?

11

Je suis tombé sur cette image dans un article de blog ici .

Quelqu'un dans une fosse de mosh expérimentant un EUREKA!  moment

J'ai été déçu que la lecture de la déclaration n'ait pas suscité la même expression faciale pour moi que pour ce type.

Alors, que veut dire l'affirmation selon laquelle l'hypothèse nulle est de savoir comment les fréquentistes expriment un prior non informatif? Est-ce vraiment vrai?


Edit: j'espère que quelqu'un peut offrir une interprétation caritative qui rend la déclaration vraie, même dans un sens vague.

jerad
la source
3
Je ne pense pas que ce soit exact. Premièrement, quelqu'un peut-il noter la probabilité d'un test T? Ensuite, nous pouvons commencer à parler d'analogies. Eh bien, et si vous ne pouvez pas ... nous cette image n'a pas de sens.
joint_p

Réponses:

10

L'hypothèse nulle n'est pas équivalente à un prieur bayésien non informatif pour la simple raison que les bayésiens peuvent également utiliser des hypothèses nulles et effectuer des tests d'hypothèse en utilisant les facteurs de Bayes. S'ils étaient équivalents, les Bayésiens n'utiliseraient pas d'hypothèses nulles.

Cependant, les tests d'hypothèse fréquentistes et bayésiens incorporent un élément d'autoscepticisme, en ce sens que nous devons montrer qu'il existe des preuves que notre hypothèse alternative est en quelque sorte une explication plus plausible des observations que le hasard. Les fréquentistes le font en ayant un niveau de signification, les Bayésiens le font en ayant une échelle d'interprétation pour le facteur Bayes, de sorte que nous ne promulguerions pas fortement une hypothèse à moins que le facteur Bayes sur l'hypothèse nulle ne soit suffisamment élevé.

La raison pour laquelle les tests d'hypothèses fréquentistes sont contre-intuitifs est qu'un fréquentiste ne peut pas attribuer une probabilité non triviale à la vérité d'une hypothèse, ce qui est malheureusement généralement ce que nous voulons réellement. Le plus proche qu'ils peuvent obtenir de cela est de calculer la valeur de p (la probabilité des observations sous H0), puis d'en tirer une conclusion subjective quant à savoir si H0 ou H1 sont plausibles. Le bayésien peut attribuer une probabilité à la vérité d'une hypothèse, et ainsi peut calculer le rapport de ces probabilités pour fournir une indication de leurs plausibilités relatives, ou au moins de la façon dont les observations modifient le rapport de ces probabilités (ce qui est ce qu'un Le facteur Bayes le fait).

À mon avis, c'est une mauvaise idée d'essayer de faire un rapprochement trop étroit entre les méthodes de test d'hypothèse fréquentiste et bayésienne car elles sont fondamentalement différentes et répondent à des questions fondamentalement différentes. Les traiter comme s'ils étaient équivalents encourage une interprétation bayésienne du test fréquentiste (par exemple, l'erreur de valeur p) qui est potentiellement dangereuse (par exemple, les sceptiques du climat supposent souvent que l'absence d'une tendance statistiquement significative de la température de surface moyenne mondiale signifie qu'il y a n'a pas eu de réchauffement - ce qui n'est pas du tout correct).

Dikran Marsupial
la source
9

La raison pour laquelle vous n'avez pas le même regard épiphanique sur votre visage que ce type est que je pense que. . . la déclaration n'est pas vraie.

Une hypothèse nulle est l'hypothèse que toute différence entre les conditions de contrôle et expérimentales est due au hasard.

Un a priori non informatif est censé indiquer que vous avez des données antérieures sur une question, mais qu'il ne vous dit rien à quoi vous attendre la prochaine fois. Un bayésien est susceptible de soutenir qu'il existe des informations dans n'importe quel précédent, même la distribution uniforme.

L'hypothèse nulle dit donc qu'il n'y a pas de différence entre contrôle et expérimental; en revanche, un a priori non informatif peut ou non être possible, et s'il ne l'indiquait en rien sur la différence entre le contrôle et l'expérimentation (ce qui est différent de l'indication que toute différence est due au hasard).

Peut-être que je manque dans ma compréhension des prieurs non informatifs, cependant. J'attends avec impatience d'autres réponses.

Krysta
la source
2
J'ajouterais seulement que les priors non informatifs concernent davantage l'attitude du chercheur que les propriétés particulièrement intéressantes de la distribution elle-même. C'est l'attitude pour laquelle Gelman plaide dans Bayesian Data Analysis, bien que je n'arrive pas à trouver le numéro de page.
Sycorax dit Réintégrer Monica le
7
L'hypothèse nulle n'est pas toujours la même. L'hypothèse nulle n'est qu'une hypothèse alternative "ennuyeuse" que vous comparez à votre hypothèse "intéressante", pour voir si les données sont compatibles l'une par rapport à l'autre. En fait, «aucune différence» est en fait une mauvaise hypothèse nulle, puisque vous savez a priori que c'est faux. Mieux vaut "la différence est inférieure à un certain seuil de prise en charge".
Stumpy Joe Pete
Merci pour la réponse @Krysta, et j'ai essentiellement pensé à la déclaration, mais peut-être y a-t-il un sens dans lequel la déclaration est un peu vraie?
jerad
Ma meilleure supposition est que l'hypothèse nulle est le point de départ des fréquentistes, ou l'ensemble vide d'hypothèses ?; cet écrivain pense peut-être que le prieur non informatif est le point de départ pour les bayésiens, mais un prieur informatif régulier est un meilleur analogue si c'est ce qu'ils voulaient dire. L'hypothèse nulle et la précédente non informative ont en quelque sorte des similitudes conceptuelles - elles supposent toutes les deux qu'il n'y a pas d'information / d'effet. Mais c'est assez vague!
Krysta
"Un bayésien est susceptible de soutenir qu'il y a des informations dans n'importe quel précédent". Mais, un prieur de Jeffreys n'est pas informatif.
Neil G
4

Voir cet article Wikipedia :

Dans le cas d'un seul paramètre et de données qui peuvent être résumées en une seule statistique suffisante, il peut être démontré que l'intervalle crédible et l'intervalle de confiance coïncideront si le paramètre inconnu est un paramètre de localisation (...) avec un a priori qui est une distribution uniforme uniforme (...) et aussi si le paramètre inconnu est un paramètre d'échelle (...) avec un a priori de Jeffreys.

En fait, la référence pointe vers Jaynes:

Jaynes, ET (1976), Intervalles de confiance vs intervalles bayésiens .

À la page 185, nous pouvons trouver:

Si le cas (I) survient (et il le fait plus souvent que prévu), les tests bayésiens et orthodoxes vont nous conduire exactement aux mêmes résultats et à la même conclusion, avec un désaccord verbal quant à savoir si nous devons utiliser la `` probabilité '' ou `` signification »pour les décrire.

Donc, en fait, il y a des cas similaires, mais je ne dirais pas que l'énoncé dans l'image est vrai si vous utilisez, par exemple, une distribution de Cauchy comme probabilité ...

random_user
la source
4

Je suis celui qui a créé le graphique, bien que, comme indiqué dans le message d'accompagnement, ce ne soit pas à l'origine ma perspicacité. Permettez-moi de fournir un contexte sur la façon dont cela a été créé et de faire de mon mieux pour expliquer comment je le comprends. La réalisation s'est produite au cours d'une discussion avec un étudiant qui avait principalement appris l'approche bayésienne de l'inférence jusqu'à ce point. Il avait du mal à comprendre tout le paradigme de tests d'hypothèses, et je faisais de mon mieux pour expliquer cette approche résolument confusion (si l' on considère la « différence » à être négatif - comme nonégal à - alors l'approche standard de l'hypothèse nulle est un triple négatif: le but des chercheurs est de montrer qu'il n'y a pas de différence). En général, et comme indiqué dans une autre réponse, les chercheurs s'attendent généralement à une certaine différence; ce qu'ils espèrent vraiment trouver, ce sont des preuves convaincantes pour «rejeter» le nul. Pour être impartiaux, cependant, ils commencent par feindre essentiellement l'ignorance, comme dans «Eh bien, peut-être que ce médicament n'a aucun effet sur les gens». Ils procèdent ensuite à la démonstration, par le biais de la collecte et de l'analyse des données (s'ils le peuvent), que cette hypothèse nulle, compte tenu des données, était une mauvaise hypothèse.

Pour un bayésien, cela doit ressembler à un point de départ alambiqué. Pourquoi ne pas simplement commencer par annoncer vos croyances antérieures directement, et être clair sur ce que vous supposez (et n'êtes pas) en codant dans une précédente? Un point clé ici est qu’un a priori uniforme n’est pasla même chose qu'un prieur non informatif. Si je lance une pièce 1000 fois et que j'obtiens 500 têtes, mon nouveau précédent attribue un poids égal (uniforme) aux têtes et aux queues, mais sa courbe de distribution est très abrupte. J'encode des informations supplémentaires très informatives! Un véritable a priori non informatif (poussé à la limite) n'aurait aucun poids. Cela signifie, en effet, partir de zéro et, pour reprendre une expression fréquentiste, laisser les données parler d'elles-mêmes. L'observation faite par "Clarence" était que la manière fréquentiste de coder ce manque d'information est avec l'hypothèse nulle. Ce n'est pas exactement la même chose qu'un prieur non informatif; c'est l'approche fréquentiste pour exprimer une ignorance maximale d'une manière honnête, qui ne présume pas ce que vous souhaitez prouver.

Matt Asher
la source
2
L'hypothèse nulle fréquentiste n'exprime pas une ignorance maximale, elle commence à supposer que l'hypothèse nulle est vraie et nous ne devons procéder à l'hypothèse alternative que si les observations sont suffisamment improbables sous H0. On pourrait faire valoir que le test d'hypothèse nulle code pour certains antérieurs, mais il est décidément informatif. À mon avis, tenter d'interpréter les tests d'hypothèse fréquentistes en termes bayésiens est erroné et une recette pour l'erreur; ce ne sont pas des réponses à la même question.
Dikran Marsupial
@Dikran Marsupial, c'est dans une certaine mesure un débat sans fin, mais d'un point de vue le plus fréquent, je ne vois aucun moyen de considérer le nul comme "décidément informatif". Si tel était le cas, le fait de ne pas rejeter le null serait considéré comme une preuve du null (puisque nous avons "déjà" des informations sur le null). Toutes les approches de l'inférence de l'OMI tentent de répondre aux mêmes questions interdépendantes: "Comment interpréter les données?" et "quelle est la force du cas?"
Matt Asher
1
Le null lui-même n'est pas informatif ou non informatif, mais le test d'hypothèse fréquentiste conventionnel est intrinsèquement (et à juste titre) biaisé vers le H0 (sauf si vous effectuez également une analyse de puissance). Ce biais peut être comparé à un précédent, mais il serait informatif. Il n'est tout simplement pas significatif de comparer les antérieurs et les hypothèses, ils servent différents objectifs dans l'analyse; note Le bayésien utilise également des hypothèses nulles dans les tests d'hypothèses (voir ma réponse à la question) où il sert le même but que dans les tests d'hypothèses fréquentistes.
Dikran Marsupial
3
Pour être clair, en utilisant l'exemple du médicament, nous ne commençons pas par feindre l'ignorance "Eh bien, peut-être que ce médicament n'a aucun effet sur les gens.", Nous commençons par supposer que l'hypothèse nulle est correcte "Le médicament n'a aucun effet et il est en hausse à la compagnie pharmaceutique de prouver qu'elle a bel et bien un effet en montrant que les résultats ne peuvent pas être correctement expliqués par hasard ». L'autoscepticisme que cette approche fournit est la raison pour laquelle le «rituel nul», malgré ses nombreux défauts, a toujours une valeur pratique en science.
Dikran Marsupial