J'essaie de construire un modèle où la réponse est une proportion (c'est en fait la part des votes qu'un parti obtient dans les circonscriptions). Sa distribution n'est pas normale, j'ai donc décidé de le modéliser avec une distribution bêta. J'ai également plusieurs prédicteurs.
Cependant, je ne sais pas comment l'écrire dans BUGS / JAGS / STAN (JAGS serait mon meilleur choix, mais cela n'a pas vraiment d'importance). Mon problème est que je fais une somme de paramètres par prédicteurs, mais que puis-je en faire?
Le code serait quelque chose comme ça (dans la syntaxe JAGS), mais je ne sais pas comment "lier" les paramètres y_hat
et y
.
for (i in 1:n) {
y[i] ~ dbeta(alpha, beta)
y_hat[i] <- a + b * x[i]
}
( y_hat
n'est que le produit croisé des paramètres et des prédicteurs, d'où la relation déterministe. a
et b
sont les coefficients que j'essaie d'estimer, x
étant un prédicteur).
Merci pour vos suggestions!
Réponses:
L'approche de régression bêta consiste à reparamétrer en termes de et ϕ . Où μ sera l'équivalent de y_hat que vous prédisez. Dans ce paramétrage, vous aurez α = μ × ϕ et β = ( 1 - μ ) × ϕ . Ensuite, vous pouvez modéliser μ comme logit de la combinaison linéaire. ϕ peut avoir son propre a priori (doit être supérieur à 0), ou peut également être modélisé sur des covariables (choisissez une fonction de lien pour la maintenir supérieure à 0, comme exponentielle).μ ϕ μ α = μ × ϕ β= ( 1 - μ ) × ϕ μ ϕ
Peut-être quelque chose comme:
la source
Greg Snow a donné une excellente réponse. Pour être complet, voici l'équivalent dans la syntaxe Stan. Bien que Stan ait une distribution bêta que vous pourriez utiliser, il est plus rapide d'élaborer vous-même le logarithme de la densité bêta car les constantes
log(y)
etlog(1-y)
peuvent être calculées une fois au début (plutôt qu'à chaque fois quey ~ beta(alpha,beta)
vous les appelleriez). En incrémentant lalp__
variable réservée (voir ci-dessous), vous pouvez additionner le logarithme de la densité bêta sur les observations de votre échantillon. J'utilise l'étiquette "gamma" pour le vecteur de paramètre dans le prédicteur linéaire.la source