Comment paramétrer le rapport de deux variables normalement distribuées, ou l'inverse d'une?

Problème: je suis en train de paramétrer des distributions à utiliser comme a priori et des données dans une méta-analyse bayésienne. Les données sont fournies dans la littérature sous forme de statistiques résumées, presque exclusivement supposées être normalement distribuées (bien qu'aucune des variables ne puisse être <0, certaines sont des ratios, certaines sont de masse, etc.).

J'ai rencontré deux cas pour lesquels je n'ai pas de solution. Parfois, le paramètre d'intérêt est l'inverse des données ou le rapport de deux variables.

Exemples:

le rapport de deux variables normalement distribuées:
- données: moyenne et sd pour le pourcentage d'azote et le pourcentage de carbone
- paramètre: rapport carbone / azote.
l'inverse d'une variable normalement distribuée:
- données: masse / surface
- paramètre: surface / masse

Mon approche actuelle consiste à utiliser la simulation:

par exemple pour un ensemble de données de pourcentage de carbone et d'azote avec les moyennes: xbar.n, c, variance: se.n, c, et la taille de l'échantillon: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Je veux paramétrer ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Ensuite, choisissez les meilleures distributions d'ajustement avec la plage pour mon précédent $0 \rightarrow \infty$

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Question: Est-ce une approche valable? Existe-t-il d'autres / meilleures approches?

Merci d'avance!

$\mu=0$

{\hat{μ}}_{y : x} = μ_{y} / m u_{x} + σ_{x}^{2} * μ_{y} / μ_{x}^{3} + c o v (x, y) * σ_{x}^{2} * σ_{y}^{2} / μ_{x}^{2}

$\hat{\mu}_{y:x} = \mu_y/mu_x + \sigma^2_x * \mu_y / \mu_x^3 + cov(x,y) * \sigma^2_x * \sigma^2_y / \mu_x^2$

{\hat{σ}}_{y : x}^{2} = σ_{x}^{2} \times μ_{y} / m u_{x}^{4} + σ_{y}^{2} / m u_{x}^{2} - 2 * c o v (x, y) * σ_{x}^{2} * σ_{y}^{2} / m u_{x}^{3}

$\hat{\sigma}^2_{y:x} = \sigma^2_x\times\mu_y / mu_x^4 + \sigma^2_y / mu_x^2 - 2 * cov(x,y) * \sigma^2_x * \sigma^2_y / mu_x^3$

Hayya, J. et Armstrong, D. et Gressis, N., 1975. Une note sur le rapport de deux variables normalement distribuées. Science de la gestion 21: 1338-1341

distributions bayesian variance random-variable meta-analysis David LeBauer
la source

dois-je poster la question de mise à jour sur le calcul de la variance sur les tirages aléatoires du Cauchy comme une question distincte?

David LeBauer

μ = 0

$\mu = 0$

μ

$\mu$

X

$X$

Y

$Y$

Z = \frac{X}{Y}

$Z = \frac{X}{Y}$

\int \int \frac{x}{y} p (x, y) d x d y

$\int \int \frac{x}{y} p \left( x, y \right) dx dy$

Réponses:

Vous voudrez peut-être consulter certaines des références sous l'article de Wikipedia sur la répartition des ratios . Il est possible que vous trouviez de meilleures approximations ou distributions à utiliser. Sinon, votre approche semble solide.

Mise à jour Je pense qu'une meilleure référence pourrait être:

Rapports de variables normales et rapports de sommes de variables uniformes (Marsaglia, 1965)

Voir les formules 2-4 à la page 195.

Update 2

Concernant votre question mise à jour concernant la variance d'un Cauchy - comme John Cook l'a souligné dans les commentaires, la variance n'existe pas. Ainsi, prendre une variance d'échantillon ne fonctionnera tout simplement pas comme un «estimateur». En fait, vous constaterez que la variance de votre échantillon ne converge pas du tout et fluctue énormément lorsque vous continuez à prélever des échantillons.

ars
la source

Merci pour la référence, c'est là que j'ai trouvé la référence Haaya 1975 et les équations dans ma question, bien que j'apprécierais d'être rassuré que les équations sont appropriées à mon problème.

David LeBauer

En jetant un rapide coup d'œil à Haaya, il semble qu'ils souhaitent obtenir une approximation normale du rapport et utiliser des simulations pour déterminer quand cela s'applique (en utilisant le coefficient de variation, cv). Le cv dans votre cas répond-il aux critères? Si oui, les approximations s'appliquent.

ars

@David: utilisez plutôt Marsaglia 1965 comme mis à jour dans la réponse.

ars

NB: Marsaglia a publié une mise à jour dans JSS en 2004 .

David LeBauer

X

$X$

Y

$Y$

Z = \frac{X}{Y}

$Z = \frac{X}{Y}$

\int \int \frac{x}{y} p (x, y) d x d y

$\int \int \frac{x}{y} p \left( x, y \right) dx dy$

$y^{-1} \sim N(.,.)$

Ma suggestion ci-dessous d'utiliser le Cauchy ne fonctionne pas comme indiqué dans les commentaires de ars et John.

Le rapport de deux variables normalement aléatoires suit la distribution de Cauchy . Vous voudrez peut-être utiliser cette idée pour identifier les paramètres du cauchy qui correspondent le mieux aux données dont vous disposez.

la source

une. J'ai besoin d'estimer la variance et la variance de la distribution de Cauchy n'est pas définie.

David LeBauer

b. Si je comprends votre deuxième point, oui, je pourrais supposer que y-1 ~ N (mu, sigma), mais j'ai encore besoin de calculer mu et sigma à partir des statistiques sommaires données pour y; aussi, j'ai choisi de ne pas considérer les distributions avec des valeurs <0 pour les variables uniquement définies> 0 (même si dans de nombreux cas p (X <0 | X ~ N (mu, s)) -> 0)

David LeBauer

Le Cauchy ne s'applique-t-il pas aux normales moyennes nulles?

ars

@ars Vous avez raison. Le cauchy peut alors être d'une utilité limitée.

Ars: Oui, je pense que le résultat Cauchy ne nécessite aucune moyenne. Mais cela signifie toujours qu'au moins dans ce cas spécial, la variance que David essaie d'estimer N'EXISTE PAS.

John D. Cook du