Le théorème de Bayes modifié de XKCD: un peu raisonnable?

81

Je sais que cela provient d'une bande dessinée célèbre pour tirer parti de certaines tendances analytiques , mais cela semble plutôt raisonnable après quelques minutes d'observation. Quelqu'un peut-il m'expliquer ce que fait ce " théorème de Bayes modifié "?

eric_kernfeld
la source
4
explicitxkcd.com/wiki/index.php/2059:_Modified_Bayes%27_Theorem l'explication de l'auteur.
Tschallacka
50
@Tschallacka Qu'est-ce qui vous fait penser que Randall a écrit ça?
kasperd
16
@Tschallacka sauf si l'un des auteurs est Randall lui-même, ce n'est pas le cas.
SQB
Mais ne devriez-vous pas appliquer le théorème de Bayes à P (C) pour mettre à jour sa valeur face à davantage de preuves?
Yakk
1
P(C)

Réponses:

107

P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1P(C)],
C=H

Je suppose que ceci est une réplique contre la critique selon laquelle les Bayésiens peuvent en principe ajuster l’avant avant d’appuyer la conclusion qu’ils veulent, alors que les Bayésiens soutiendraient que ce n’est pas ainsi que les statistiques bayésiennes fonctionnent.

(Et oui, vous avez réussi à me tirer dessus. Je ne suis ni mathématicien ni physicien, alors je ne suis pas sûr du nombre de points que je vaux.)

Tddevlin
la source
60
Une blague intelligente qui est intégrée dans la formule ci-dessus est que si vous n'utilisez pas correctement les statistiques bayésiennes, votre inférence est complètement indépendante de la vérité.
Cliff AB
25
J'espère que vous n'avez pas tapé votre réponse en traversant une rue animée. Je ne participerai pas à ça ...
eric_kernfeld
6
Les statuts bayésiens ci-dessus ne sont pas des statisticiens bayésiens, mais des juristes bayésiens.
kjetil b halvorsen
4
@ CliffAB Je ne sais pas si j'appellerais cela une blague intelligente ou une loi de la nature.
eric_kernfeld
7
@CLiffAB Voulez-vous dire "Votre postérieur (tel que calculé par cette formule) est indépendant de la preuve"?
Accumulation du
31

Croyez-le ou non, ce type de modèle apparaît de temps en temps dans des modèles statistiques très sérieux, en particulier lorsqu'il s'agit de la fusion de données, c'est-à-dire en essayant de combiner l'inférence de plusieurs capteurs en essayant d'inférer un événement unique.

ABAest vrai (c’est-à-dire que la probabilité que ce capteur se soit égaré devient très élevée lorsque nous réalisons qu’elle est en contradiction avec tous les autres capteurs). Si la distribution des défaillances est indépendante du paramètre sur lequel nous voulons effectuer une inférence, alors si la probabilité postérieure qu'il s'agit d'une défaillance est élevée, les mesures de ce capteur ont très peu d'effet sur la distribution postérieure du paramètre d'intérêt; en fait, indépendance si la probabilité postérieure d’échec est 1.

S'agit-il d'un modèle général à prendre en compte lorsqu'il s'agit d'inférence, c'est-à-dire, devrions-nous remplacer le théorème de Bayes par le théorème de Bayes modifié lorsque nous effectuons des statistiques bayésiennes? La raison en est que "utiliser correctement les statistiques bayésiennes" n'est pas simplement binaire (ou si c'est le cas, c'est toujours faux). Toute analyse aura des degrés d'hypothèses incorrectes. Pour que vos conclusions soient complètement indépendantes des données (ce qui est impliqué dans la formule), vous devez faire des erreurs extrêmement graves. Si "utiliser les statistiques bayésiennes de manière incorrecte" à n'importe quel niveau signifiait que votre analyse était totalement indépendante de la vérité, l'utilisation des statistiques serait totalement inutile. Tous les modèles sont faux mais certains sont utiles et tout ça.

Cliff AB
la source
5
Je suppose que nous avons eu de la chance en découvrant que le mode de défaillance statique de nos capteurs est un extrême ou l’autre. Réduire le bruit est beaucoup plus difficile cependant. C'est vraiment ennuyant de découvrir que le capteur fonctionne correctement et que la valeur reçue est fausse car le fil agit comme une antenne.
Josué
@ Joshua, j'espère qu'un jour, j'aurai le temps d'apprendre correctement le filtrage de Kalman pour ce genre de situation (ou peut-être que quelqu'un écrira une brillante réponse SE qui rend tout clair?).
mbrig
μiN(aiμ,1)t(df=10)i
Cliff AB