Qu'est-ce qu'une bonne distribution préalable des degrés de liberté dans la distribution?

Je souhaite utiliser à la distribution pour modéliser les rendements des actifs à court intervalle dans un modèle bayésien. Je voudrais estimer à la fois les degrés de liberté (ainsi que d'autres paramètres de mon modèle) pour la distribution. Je sais que les rendements des actifs sont tout à fait inhabituels, mais je n'en sais pas trop au-delà.

Quelle est une distribution a priori appropriée et légèrement informative des degrés de liberté dans un tel modèle?

distributions bayesian modeling prior John Salvatier
la source

Une distribution t pourrait ne pas être un bon choix, car elle est symétrique alors que les rendements des actifs ont tendance à avoir une forte asymétrie. Au minimum, envisagez de modéliser les logarithmes des rendements plutôt que les rendements eux-mêmes.

whuber

Oui, c'est un bon point, j'y pensais dans le fond de mon esprit, mais cette question m'intéresse toujours.

John Salvatier

Avez-vous une énorme quantité de données? Je pense qu'il est plus courant même dans la modélisation bayésienne de fixer le df et d'essayer différentes valeurs comme analyse de sensibilité.

onestop

Voici un article qui pourrait vous aider. portfolioprobe.com/2011/01/12/the-number-1-novice-quant-mistake

bill_080

J'essaierais d'utiliser la distribution de Laplace pour les rendements des actifs, également appelée «double exponentielle» est stats-world et «variance-gamma» dans Finance world.

Probabilogic

Réponses:

À la page 372 de ARM , Gelman et Hill mentionnent l'utilisation d'une distribution uniforme sur l'inverse de DF entre 1 / DF = 0,5 et 1 / DF = 0.

Plus précisément, dans BUGS, ils utilisent:

nu.y <- 1/nu.inv.y 
nu.inv.y ~ dunif(0,.5)

John Salvatier
la source

Puis-je demander, dans PyMC3, le nuparamètre de la distribution StudentsT est-il le degré de liberté, ou son inverse?

ericmjl

Mon mauvais, je n'ai pas lu les documents. C'est un entier.

ericmjl

ARM (tel que référencé par John Salvatier dans sa réponse) a été initialement publié en 2006. Depuis lors, il a été préconisé d'utiliser un auparavant. Cet a priori a été proposé par Juárez et Steel (2010) dans leur article Model-based clustering of non-Gaussian panel data based on skew-t distributions . $\nu \sim \text{Gamma}(2, 0.1)$

Gelman a fait le post suivant en 2015: «Avons-nous des recommandations pour les prieurs pour le paramètre des degrés de liberté de student_t?» , qui aborde ce sujet plus en détail (ainsi que la complexité pénalisée précédemment proposée par Simpson et al (2014)).

Ralph
la source