J'ai un ensemble de données assez simple composé d'une variable indépendante, d'une variable dépendante et d'une variable catégorielle. J'ai beaucoup d'expérience dans les tests fréquentistes comme aov()
et lm()
, mais je ne sais pas comment effectuer leurs équivalents bayésiens en R.
Je voudrais exécuter une régression linéaire bayésienne sur les deux premières variables et une analyse bayésienne de la variance en utilisant la variable catégorielle comme regroupements, mais je ne trouve aucun exemple simple sur la façon de le faire avec R. Est-ce que quelqu'un peut fournir un exemple de base pour tous les deux? De plus, quelles sont exactement les statistiques de sortie créées par l'analyse bayésienne et qu'expriment-elles?
Je ne connais pas très bien les statistiques, mais le consensus semble être que l'utilisation de tests de base avec des valeurs de p est maintenant considérée comme quelque peu erronée, et j'essaie de suivre. Cordialement.
Réponses:
Si vous avez l'intention de faire beaucoup de statistiques bayésiennes, il vous serait utile d'apprendre le langage BUGS / JAGS, accessible en R via les packages R2OpenBUGS ou R2WinBUGS.
Cependant, pour un exemple rapide qui ne nécessite pas de comprendre la syntaxe BUGS, vous pouvez utiliser le package "bayesm" qui a la fonction runiregGibbs pour l'échantillonnage à partir de la distribution postérieure. Voici un exemple avec des données similaires à celles que vous décrivez .....
Les extraits de la sortie sont: Anova: Bayésien:
lm ():
Régression linéaire simple: bayésienne:
lm ():
2 modèle covariable: Bayésien:
lm ():
à partir de laquelle nous pouvons voir que les résultats sont largement comparables, comme prévu avec ces modèles simples et a priori diffus. Bien sûr, il vaut également la peine d'inspecter les tracés de diagnostic MCMC - densité postérieure, tracé, auto-corrélation - pour lesquels j'ai également donné le code ci-dessus (tracés non représentés).
la source
Le package BayesFactor (illustré ici: http://bayesfactorpcl.r-forge.r-project.org/ et disponible sur CRAN) permet l'ANOVA bayésienne et la régression. Il utilise des facteurs de Bayes pour la comparaison des modèles et permet un échantillonnage postérieur pour l'estimation.
la source
C'est assez pratique avec le
LearnBayes
package.La
blinreg
fonction utilise un prior non informatif par défaut, ce qui donne une inférence très proche de la fréquentiste.Estimations :
Intervalles de confiance :
la source