Problème: je suis en train de paramétrer des distributions à utiliser comme a priori et des données dans une méta-analyse bayésienne. Les données sont fournies dans la littérature sous forme de statistiques résumées, presque exclusivement supposées être normalement distribuées (bien qu'aucune des variables ne puisse être <0, certaines sont des ratios, certaines sont de masse, etc.).
J'ai rencontré deux cas pour lesquels je n'ai pas de solution. Parfois, le paramètre d'intérêt est l'inverse des données ou le rapport de deux variables.
Exemples:
- le rapport de deux variables normalement distribuées:
- données: moyenne et sd pour le pourcentage d'azote et le pourcentage de carbone
- paramètre: rapport carbone / azote.
- l'inverse d'une variable normalement distribuée:
- données: masse / surface
- paramètre: surface / masse
Mon approche actuelle consiste à utiliser la simulation:
par exemple pour un ensemble de données de pourcentage de carbone et d'azote avec les moyennes: xbar.n, c, variance: se.n, c, et la taille de l'échantillon: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Je veux paramétrer ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Ensuite, choisissez les meilleures distributions d'ajustement avec la plage pour mon précédent
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Question: Est-ce une approche valable? Existe-t-il d'autres / meilleures approches?
Merci d'avance!
Hayya, J. et Armstrong, D. et Gressis, N., 1975. Une note sur le rapport de deux variables normalement distribuées. Science de la gestion 21: 1338-1341
la source
Réponses:
Vous voudrez peut-être consulter certaines des références sous l'article de Wikipedia sur la répartition des ratios . Il est possible que vous trouviez de meilleures approximations ou distributions à utiliser. Sinon, votre approche semble solide.
Mise à jour Je pense qu'une meilleure référence pourrait être:
Voir les formules 2-4 à la page 195.
Update 2
Concernant votre question mise à jour concernant la variance d'un Cauchy - comme John Cook l'a souligné dans les commentaires, la variance n'existe pas. Ainsi, prendre une variance d'échantillon ne fonctionnera tout simplement pas comme un «estimateur». En fait, vous constaterez que la variance de votre échantillon ne converge pas du tout et fluctue énormément lorsque vous continuez à prélever des échantillons.
la source
Ma suggestion ci-dessous d'utiliser le Cauchy ne fonctionne pas comme indiqué dans les commentaires de ars et John.
Le rapport de deux variables normalement aléatoires suit la distribution de Cauchy . Vous voudrez peut-être utiliser cette idée pour identifier les paramètres du cauchy qui correspondent le mieux aux données dont vous disposez.la source