J'ai récemment commencé à lire "Introduction to Bayesian Statistics" 2nd Edition by Bolstad. J'ai eu une classe de statistiques d'introduction qui couvrait principalement des tests statistiques et je suis presque à travers une classe d'analyse de régression. Quels autres livres puis-je utiliser pour compléter ma compréhension de celui-ci?
Je l'ai fait à travers les 100 à 125 premières pages très bien. Ensuite, le livre commence à parler de tests d'hypothèses, ce que je suis très heureux de couvrir, mais il y a quelques choses qui me lancent:
- L'utilisation de fonctions de densité de probabilité dans les calculs. En d'autres termes, comment évaluer de telles équations.
- Cette phrase entière: "Supposons que nous utilisons un bêta (1,1) avant pour pi. Alors étant donné y = 8, la densité postérieure est bêta (9,3). La probabilité postérieure de l'hypothèse nulle est ..." Je crois beta (1,1) se réfère à un PDF où la moyenne est 1 et le stdev est 1? Je ne comprends pas comment cela changerait en bêta (9,3) en tant que fonction de densité postérieure.
Je comprends le concept des prieurs contre les postérieurs et je comprends comment les appliquer manuellement à l'aide d'un tableau. Je reçois (je pense!) Que pi représente la proportion ou probabilité supposée de la population.
Je ne sais pas comment connecter cela avec des données que je rencontrerais quotidiennement et obtenir des résultats.
la source
Réponses:
Je pense que vous y pensez toujours d'un point de vue fréquentiste: si vous cherchez une estimation ponctuelle, le postérieur ne vous la donnera pas. Vous mettez des PDF, vous sortez des PDF. Vous pouvez dériver des estimations ponctuelles en calculant des statistiques à partir de votre distribution postérieure, mais j'y reviendrai dans un instant.
est la même chose que p ( x ) : ce sont tous les deux des PDF. π est juste conventionnellement utilisé pour indiquer que le PDF particulier est une densité antérieure.π( x ) p ( x ) π
Je soupçonne que vous n'obtenez pas les prieurs et les postérieurs aussi bien que vous le pensez, alors revenons à la base fondamentale des statistiques bayésiennes: la probabilité subjective .
Une expérience de réflexion sur la probabilité subjective
Disons que je vous présente une pièce et vous demande si vous pensez ou non que cette pièce est une pièce équitable. Vous avez entendu beaucoup de gens parler de pièces de monnaie déloyales dans la classe de probabilité, mais vous n'en avez jamais vu dans la vraie vie, alors vous répondez: "Oui, bien sûr, je pense que c'est une pièce de monnaie équitable." Mais, le fait que je vous pose même cette question vous décourage un peu, donc même si vous pensez que c'est juste, vous ne seriez pas vraiment surpris si ce n'était pas le cas. Beaucoup moins surpris que si vous trouviez cette pièce dans votre monnaie (car vous supposez que tout cela est de la vraie monnaie, et vous ne me faites pas vraiment confiance en ce moment car je me méfie).
Maintenant, nous exécutons quelques expériences. Après 100 flips, la pièce rend 53 têtes. Vous êtes beaucoup plus confiant que c'est une pièce équitable, mais vous êtes toujours ouvert à la possibilité que ce ne soit pas le cas. La différence est que maintenant vous seriez assez surpris si cette pièce s'avérait avoir une sorte de biais.
Comment pouvons-nous représenter ici vos croyances antérieures et postérieures, en particulier en ce qui concerne la probabilité que la pièce montre des têtes (que nous désignerons )? Dans un contexte fréquentiste, votre croyance antérieure - votre hypothèse nulle - est que θ = 0,5 . Après avoir exécuté l'expérience, vous n'êtes pas en mesure de rejeter la valeur nulle, et vous continuez donc avec l'hypothèse que oui, la pièce est probablement juste. Mais comment résumer le changement de votre confianceθ θ = 0,5 que la pièce est juste? Après l'expérience, vous êtes en mesure de parier que la pièce est juste, mais avant l'expérience, vous auriez été trépidant.
Alors, comment faisons-nous des calculs?
Nous commençons avec les PDF et nous terminons avec les PDF. Lorsque vous devez déclarer une estimation ponctuelle, vous pouvez calculer des statistiques telles que la moyenne, la médiane ou le mode de votre distribution postérieure (en fonction de votre fonction de perte, dans laquelle je n'entrerai pas maintenant. Restons simplement avec la moyenne). Si vous avez une solution de formulaire fermé pour votre PDF, il sera probablement trivial de déterminer ces valeurs. Si le postérieur est compliqué, vous pouvez utiliser des procédures telles que MCMC pour échantillonner à partir de votre postérieur et dériver des statistiques de l'échantillon que vous avez dessiné.
Dans l'exemple où vous avez une probabilité bêta antérieure et une probabilité binomiale, le calcul du postérieur se réduit à un calcul très net. Donné:
Ensuite, le postérieur se réduit à:
Cela se produira à chaque fois que vous avez une version bêta antérieure et une probabilité binomiale, et la raison pour laquelle cela devrait être évident dans les calculs fournis par DJE . Lorsqu'un modèle de probabilité a priori donné donne toujours un postérieur qui a le même type de distribution que l'a priori, la relation entre les types de distributions utilisés pour l'a priori et la vraisemblance est appelée conjugué . Il existe de nombreuses paires de distributions qui ont des relations conjuguées, et la conjugaison est très souvent mise à profit par les Bayésiens pour simplifier les calculs. Étant donné une probabilité particulière, vous pouvez vous faciliter la vie en sélectionnant un antécédent conjugué (s'il en existe un et vous pouvez justifier votre choix d'antériorité).
Dans le paramétrage commun de la distribution normale, les deux paramètres signifient la moyenne et l'écart type de la distribution. Mais c'est ainsi que nous paramétrons la distribution normale. D'autres distributions de probabilité sont paramétrées très différemment.
Comme vous pouvez le voir clairement, la moyenne et la variance ne font pas partie du paramétrage de cette distribution, mais elles ont des solutions de forme fermée qui sont de simples fonctions des paramètres d'entrée.
la source
Le bêta a priori avec une vraisemblance binomiale (nombre fixe d'essais avec des résultats binaires et des probabilités fixes de succès / échec) a la propriété de la conjugaison, ce qui permet au postérieur (le produit de l'a priori et de la probabilité) d'être écrit sous forme fermée:
Cette expression de forme fermée est pratique, mais en aucun cas nécessaire. La multiplication des densités de probabilité peut se faire de la même manière que la multiplication d'autres expressions mathématiques; les difficultés arrivent car de nombreux produits de densités ne sont pas aussi facilement réécrits que la vraisemblance a priori / binomiale bêta. Heureusement, c'est là que les ordinateurs prennent le relais.
la source
Si vous cherchez une approche plus douce, je peux fortement recommander le livre de Kruschke qui utilise R pour expliquer les concepts de base. C'est une approche très pratique et pratique de l'apprentissage des statistiques bayésiennes et sur son site Web vous pouvez trouver tous les codes utilisés.
Quelqu'un m'a également recommandé le texte de Cam.Davidson.Pilon, je ne l'ai pas encore regardé mais il peut être trouvé ici .
la source