Quel ratio de distributions indépendantes donne une distribution normale?

12

Le rapport de deux distributions normales indépendantes donne une distribution de Cauchy. La distribution t est une distribution normale divisée par une distribution chi carré indépendante. Le rapport de deux distributions khi-deux indépendantes donne une distribution F.

Je recherche un rapport de distributions continues indépendantes qui donne une variable aléatoire normalement distribuée avec une moyenne et une variance ?σ 2μσ2

Il existe probablement un ensemble infini de réponses possibles. Pouvez-vous me donner certaines de ces réponses possibles? J'apprécierais particulièrement si les deux distributions indépendantes dont le rapport est calculé sont identiques ou au moins ont une variance similaire.

Remi.b
la source
2
Bien que l'article de Wikipedia sur les répartitions de ratios ne fournisse pas d'exemples de cas pour lesquels vous recherchez, c'est une lecture intéressante.
Avraham
2
Un cas assez spécial est une normale standard, et indépendamment chacun avec une probabilité , alors , et ont la même moyenne et variance et est normalement distribué. Y ± 1 1XY±1 XYX12XY XXYXY
Henry
1
" Le rapport de deux distributions khi-deux indépendantes donne une distribution F " --- enfin, pas tout à fait. Il donne une distribution beta-prime. Pour obtenir un F, vous devez mettre à l'échelle chaque chi carré par son df.
Glen_b -Reinstate Monica
2
Un certain nombre de choses ne me rendent pas du tout convaincu qu'il est nécessairement possible de remplir toutes vos conditions.
Glen_b -Reinstate Monica
1
en prenant la méthode de génération de variables normales (par exemple Box-Muller) comme exemple (qui utilise la méthode du cercle), je dirais qu'il n'y a pas de rapports de distributions uniformes qui donnent une distribution normale (en supposant que des distributions uniformes soient demandées)
Nikos M.

Réponses:

5

Soit Ea une distribution exponentielle de moyenne2σ2etZ=±1de probabilité égale. SoitY2=1/Y1=ZEE2σ2Z=±1BBeta(0,5,0,5). En supposant que(Z,E,B)sont mutuellement indépendants, alorsY1est indépendant deY2etY1/Y2Normal(0,σ2). Nous avons doncY2=1/BBBeta(0.5,0.5)(Z,E,B)Y1Y2Y1/Y2Normal(0,σ2)

  1. indépendant de Y 2 ;Y1Y2
  2. Les deux continus; tel que
  3. .Y1/Y2Normal(0,σ2)

Je n'ai pas compris comment obtenir un . Il est plus difficile de voir comment procéder car le problème se réduit à trouver A et B qui sont indépendants tels que A - B μNormal(μ,σ2)AB qui est un peu plus difficile que de faireA/BNormal(0,1)pourAetBindépendants.

ABμBNormal(0,1)
A/BNormal(0,1)AB
gars
la source
1
Si c'est vrai, c'est génial.
Neil G
2
@NeilG c'est vrai; le produit de ma bêta et exponentielle est un gamma de forme 1/2 (en raison de la façon dont vous pouvez construire la bêta et un gamma indépendant en utilisant des gammas). Ensuite, la racine carrée de celle-ci est semi-normale en utilisant le fait que le carré d'une normale est un chi carré.
gars
1
Nous avions récemment une question demandant un produit de deux variables qui est distribué normalement (je ne le retrouve pas). Cette question avait un commentaire ou une réponse concernant la transformée de Box-Muller qui calcule une distribution normale (ou plus précisément une distribution normale bivariée) à partir du produit de deux variables distribuées uniformes transformées. Cette réponse se rapporte beaucoup à cela, mais prend l'inverse de l'une de ces variables dans la transformée de Box-Muller. cc: @kjetilbhalvorsen
Sextus Empiricus
1

J'apprécierais particulièrement si les deux distributions indépendantes dont le ratio est calculé sont les mêmes 

Il n'y a aucune possibilité qu'une variable normale puisse être écrite comme un rapport de deux variables indépendantes avec la même distribution ou famille de distribution (comme la distribution F qui est le rapport de deux variables distribuées χ2 échelonnées ou la distribution de Cauchy qui est le rapport de deux variables distribuées normales avec une moyenne nulle).

  • Supposons que: pour tout A,BFF est la même distribution ou famille de distribution, nous avons

    X=ABN(μ,σ2)

  • Nous devons également être capables d'inverser A et B (si une variable normale peut être écrite comme un rapport de deux variables indépendantes avec la même distribution ou famille de distribution, alors l'ordre peut être inversé)

    1X=BAN(μ,σ2)

  • Mais si XN(μ,σ2) alors X1N(μ,σ2) ne peut pas être vrai (l'inverse d'une variable distribuée normale n'est pas une autre variable distribuée normale).

Conclusion plus large: si les variables d'une famille de distribution FX peuvent être écrites comme un rapport de variables dans une autre famille de distribution FY alors il faut que la famille FX soit fermée en prenant la réciproque (c'est-à-dire pour toute variable dont la distribution est en FX la distribution de son réciproque sera également dans FX ).

Par exemple, l'inverse d'une variable distribuée de Cauchy est également distribué par Cauchy. L'inverse d'une variable F-distribuée est également F-distribuée.

  • Ce «si» n'est pas un «si», l'inverse n'est pas vrai. Lorsque X et 1/X sont dans la même famille de distribution, il peut ne pas toujours être possible d'écrire comme une distribution de rapport avec le nominateur et le dénominateur de la même famille de distribution.

    Contre-exemple: on peut imaginer des familles de distribution pour lesquelles pour tout X de la famille on a 1/X dans la même famille mais on n'a pas P(X=1)=0 . Cela contredit le fait que pour une distribution de ratios où le dénominateur et le nominateur ont la même distribution, nous devons avoir P(X=1)0 (et quelque chose de similaire peut être exprimé pour des distributions continues comme l'intégrale le long de la ligne X / Y = 1 dans un nuage de points de X, Y a une densité non nulle lorsque X et Y ont la même distribution et sont indépendants).

Sextus Empiricus
la source
Ne le vois pas. Il me semble que juste parce que et B / C sont normaux, cela ne fait pas A / DA/DB/C normal. A/DB/C
Carl
Mieux. Maintenant, c'est logique.
Carl
1
Je ne comprends pas comment la deuxième déclaration découle de la première. S'il existe des tels que leur quotient est normal, pourquoi s'ensuit-il que leur quotient dans l'autre ordre devrait également être normal? La question ne demandait pas une famille de distribution telle que le quotient de toutes les paires d'éléments soit normal. A,B
Neil G
1
Je ne comprends pas ce que tu dis. Idéalement, votre réponse serait un argument cohérent sans exiger que quelqu'un lise les modifications. En ce moment, il semble que votre deuxième déclaration ("nous devons aussi avoir") ne découle pas de la première.
Neil G
1
@kjetilbhalvorsen comment doit-il être révisé? J'ai répondu à la partie de la question qui précise "J'apprécierais particulièrement si les deux distributions indépendantes dont le rapport est calculé sont les mêmes" . Je ne vois pas comment la réponse par gars s'y rapporte.
Sextus Empiricus
0

Eh bien, en voici un mais je ne le prouverai pas, je ne le montrerai qu'en simulation.

Faites deux distributions bêta avec des paramètres de grande forme égaux (ici, n = 40 , 000 ), soustrayez 1/2 des valeurs x de l'un d'entre eux et appelez-le "numérateur". Cela nous donne un PDF qui a une plage maximale de ( - 1Beta(200,200)n=40,000x, mais parce que les paramètres de forme sont si grands, nous n'atteignons jamais les valeurs maximales de la plage. Voici un histogramme d'unn=40,000« numérateur » (12,12)n=40,000entrez la description de l'image ici

Ensuite, nous appelons la deuxième distribution bêta "dénominateur" sans soustraire quoi que ce soit, donc elle a la plage de distribution bêta habituelle de et l'une d'elles ressemble à ceci(0,1)

entrez la description de l'image ici

Encore une fois, parce que les formes sont si grandes, nous n'abordons pas la plage maximale avec les valeurs. Ensuite, nous traçons le numérateur de quotient sous forme de PDF avec la distribution normale superposée.numeratordenominator

entrez la description de l'image ici

Maintenant, dans ce cas, le résultat de la distribution normale a et les tests de normalité qui ressemblent à ceciμ0.0000204825,σ0.0501789

(StatisticP-ValueAnderson-Darling0.7997860.481181Baringhaus-Henze1.405850.0852017Cramér-von Mises0.1231450.482844Jarque-Bera ALM4.481030.106404Kolmogorov-Smirnov0.004523280.386335Kuiper0.007980630.109127Mardia Combined4.481030.106404Mardia Kurtosis1.538490.123929Mardia Skewness2.093990.147879Pearson χ2134.3530.571925Watson U20.1138310.211187)

En d'autres termes, nous ne pouvons pas prouver que le rapport n'est pas normal, même en essayant très fort de le faire.

Maintenant pourquoi? Intuition de ma part, que j'ai en surabondance. Preuve laissée au lecteur, le cas échéant (peut-être via la limite de la méthode des moments, mais là encore, ce n'est que de l'intuition).

Beta(20,20)Beta(20,20)12tμ0.000251208,σ0.157665,df33.0402

entrez la description de l'image ici

StatisticP-ValueAnderson-Darling0.2752620.955502Cramér-von Mises0.03511080.956524Kolmogorov-Smirnov0.003209360.804486Kuiper0.005565010.657146Pearson χ2145.0770.323168Watson U20.03510420.878202

N(0,1)N(10,1/1000)t μ0.0000535722,σ0.0992765,df244.154

entrez la description de l'image ici

(StatisticP-ValueAnderson-Darling0.5016770.745102Cramér-von Mises0.06968240.753515Kolmogorov-Smirnov0.003556880.692225Kuiper0.006083820.501133Pearson χ2142.880.370552Watson U20.06032070.590369)
Carl
la source
5
Vous êtes clairement très proche d'une distribution normale. Cependant, ce n'est pas du tout la même chose que d'avoir une distribution normale, et je ne crois pas que le rapport d'une bêta symétrique centrée à une bêta symétrique ordinaire avec les mêmes paramètres soit jamais réellement normal. Je serais très intéressé à me tromper à ce sujet.
Glen_b -Reinstate Monica
2
Votre solution n'est certainement pas normale. Vous pouvez généraliser cette approche: prendre n'importe quelle distribution qui est approximativement normale et la diviser par une distribution avec sa probabilité concentrée près d'un nombre différent de zéro. Le résultat (évidemment) sera proche de Normal - mais ce ne sera toujours pas Normal. L'application d'un tas de tests n'est pas convaincante car tout cela montre que vous n'avez pas généré suffisamment d'échantillons pour démontrer la non-normalité.
whuber
1
108
2
Permettez-moi d'aller au cœur du sujet, alors: (1) réfuter la normalité est un simple exercice d'approximation intégrale - pas besoin de donner les détails ici. Par exemple , vous pouvez facilement prouver que le 200e moment est infini. (2) Votre réponse confond les distributions avec des échantillons. C'est à cette confusion fondamentale que je m'oppose; c'est la raison pour laquelle je pense que cette réponse est plus trompeuse qu'utile. BTW, je n'ai pas écrit mon dernier commentaire à la légère: j'ai effectué ce test. Je ne l'ai pas fait avec un supercalculateur, mais avec une station de travail PC vieille de dix ans, et l'ensemble du processus n'a pris que quelques secondes.
whuber
1
@whuber Quelle approximation testez-vous? Le premier, le deuxième ou le troisième? BTW, si ce ne sont que des approximations, tant pis. Je suggère seulement que dans le cas limite, ils pourraient être exacts. Toutes les statistiques sont une approximation donc je ne partage pas votre appréhension.
Carl
-3

X1G,X2GXγC

X1GX2G=XγC

XγC1/X1/γCγ

X1G=X2G/X1/γC

μμσγ1/γ

chuse
la source
4
Veuillez tester votre hypothèse, soit par calcul explicite du ratio, soit par simulation. Soit montrera que votre réclamation est incorrecte. L'erreur réside dans l'hypothèse que les rapports de distribution peuvent être «annulés» pour «résoudre» le numérateur.
whuber
1
X2G