J'ai récemment trouvé nécessaire de dériver un pdf pour le carré d'une variable aléatoire normale avec une moyenne de 0. Pour une raison quelconque, j'ai choisi de ne pas normaliser la variance au préalable. Si je l'ai fait correctement, ce pdf est le suivant:
J'ai remarqué que ce n'était en fait qu'une paramétrisation d'une distribution gamma:
Et puis, du fait que la somme de deux gammas (avec le même paramètre d'échelle) est égale à un autre gamma, il s'ensuit que le gamma est équivalent à la somme de variables aléatoires normales au carré.
C'était un peu surprenant pour moi. Même si je savais que la - une distribution de la somme des VR normaux au carré standard - était un cas spécial du gamma, je ne savais pas que le gamma était essentiellement juste une généralisation permettant la somme de la normale variables aléatoires de toute variance. Cela conduit également à d'autres caractérisations que je n'avais pas rencontrées auparavant, telles que la distribution exponentielle étant équivalente à la somme de deux distributions normales au carré.
Tout cela est quelque peu mystérieux pour moi. La distribution normale est-elle fondamentale pour la dérivation de la distribution gamma, de la manière décrite ci-dessus? La plupart des ressources que j'ai vérifiées ne mentionnent pas que les deux distributions sont intrinsèquement liées comme ça, ou même d'ailleurs décrivent comment le gamma est dérivé. Cela me fait penser qu'une vérité de niveau inférieur est en jeu que j'ai simplement mise en évidence de manière alambiquée?
Réponses:
Comme l'a noté le commentaire du professeur Sarwate, les relations entre la normale au carré et le chi carré sont un fait très largement diffusé - car il devrait également être le fait qu'un chi carré n'est qu'un cas particulier de la distribution Gamma:
la dernière égalité résultant de la propriété de mise à l'échelle du Gamma.
En ce qui concerne la relation avec l'exponentielle, pour être précis, c'est la somme de deux normales de moyenne nulle au carré, chacune mise à l'échelle par la variance de l'autre , qui conduit à la distribution exponentielle:
Mais le soupçon qu'il y a "quelque chose de spécial" ou de "plus profond" dans la somme de deux normales moyennes au carré zéro qui "en fait un bon modèle pour le temps d'attente" n'est pas fondé: tout d'abord, ce qui est spécial au sujet de la distribution exponentielle qui fait -ce un bon modèle pour le "temps d'attente"? L'absence de mémoire bien sûr, mais y a-t-il quelque chose de "plus profond" ici, ou simplement la forme fonctionnelle simple de la fonction de distribution exponentielle, et les propriétés de ? Les propriétés uniques sont éparpillées partout dans les mathématiques, et la plupart du temps, elles ne reflètent pas une "intuition plus profonde" ou une "structure" - elles existent simplement (heureusement).e
Deuxièmement, le carré d'une variable a très peu de relation avec son niveau. Considérez simplement in, disons, :[ - 2 ,F( x ) = x [ - 2 ,2 ]
... ou représenter graphiquement la densité normale standard par rapport à la densité du chi carré: ils reflètent et représentent des comportements stochastiques totalement différents, même s'ils sont si intimement liés, car le second est la densité d'une variable qui est le carré du premier. La normale peut être un pilier très important du système mathématique que nous avons développé pour modéliser le comportement stochastique - mais une fois que vous l'ajustez, cela devient quelque chose de totalement différent.
la source
Abordons la question posée: tout cela est quelque peu mystérieux pour moi. La distribution normale est-elle fondamentale pour la dérivation de la distribution gamma ...? Pas de mystère vraiment, c'est simplement que la distribution normale et la distribution gamma sont membres, entre autres de la famille exponentielle de distributions, laquelle famille est définie par la capacité de convertir entre des formes équationnelles par substitution de paramètres et / ou de variables. En conséquence, il existe de nombreuses conversions par substitution entre distributions, dont quelques - unes sont résumées dans la figure ci-dessous.
LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (février 2008). "Relations de distribution univariées" (PDF). Statisticien américain. 62 (1): 45-53. doi: 10.1198 / 000313008x270448 citer
Voici deux relations de distribution normale et gamma plus en détail (parmi un nombre inconnu d'autres, comme via le chi carré et la bêta).
Premièrement, une relation plus directe entre la distribution gamma (GD) et la distribution normale (ND) avec zéro moyen suit. Autrement dit, le GD prend une forme normale car son paramètre de forme peut augmenter. Il est plus difficile de prouver que tel est le cas. Pour le GD,
Comme le paramètre de forme GD , la forme GD devient plus symétrique et normale, cependant, comme la moyenne augmente avec l'augmentation de , nous devons déplacer le GD de gauche de pour le maintenir stationnaire, et enfin, si nous souhaitons conserver le même écart-type pour notre GD décalé, nous devons diminuer le paramètre d'échelle ( ) proportionnel à .a→∞ a (a−1)1a−−√k b 1a−−√
A savoir, pour transformer un GD en un cas limite ND, nous définissons l'écart type comme une constante ( ) en laissant et en déplaçant le GD vers la gauche pour avoir un mode de zéro en substituantEnsuitek b=1a−−√k z=(a−1)1a−−√k+x .
Notez que dans la limite en tant la valeur la plus négative de pour laquelle ce GD est différent de zéro . Autrement dit, le support GD semi-infini devient infini . En prenant la limite comme du GD reparameterized, nous trouvonsa→∞ x →−∞ a→∞
Graphiquement pour et le GD est en bleu et le limitant est en orange, en dessousk=2 a=1,2,4,8,16,32,64 ND(x;0, 22)
Deuxièmement, soulignons qu'en raison de la similitude de forme entre ces distributions, on peut à peu près développer des relations entre le gamma et les distributions normales en les tirant hors de l'air. A savoir, nous développons ensuite une généralisation de la distribution gamma "dépliée" d'une distribution normale.
Notez d'abord que c'est le support semi-infini de la distribution gamma qui entrave une relation plus directe avec la distribution normale. Cependant, cet obstacle peut être supprimé en considérant la distribution semi-normale, qui a également un support semi-infini. Ainsi, on peut généraliser la distribution normale (ND) en la pliant d'abord pour qu'elle soit semi-normale (HND), en la reliant à la distribution gamma généralisée (GD), puis pour notre tour de force, on "déplie" les deux (HND et GD) pour faire ainsi un ND généralisé (un GND).
La distribution gamma généralisée
Peut être reparamétrisé pour être la distribution semi-normale ,
Notez queAinsi,θ=π√σ2√.
ce qui implique que
est une généralisation de la distribution normale, où est l'emplacement, est l'échelle et est la forme et où donne une distribution normale. Il inclut la distribution de Laplace lorsque . Comme , la densité converge ponctuellement vers une densité uniforme sur . Vous trouverez ci-dessous la distribution normale généralisée tracée pour en bleu avec le cas normal en orange.μ α>0 β>0 β=2 β=1 β→∞ (μ−α,μ+α) α=π√2,β=1/2,1,4 α=π√2,β=2
Ce qui précède peut être considéré comme la distribution normale généralisée version 1 et dans différentes paramétrisations est connue comme la distribution de puissance exponentielle et la distribution d'erreur généralisée, qui sont à leur tour l'une des nombreuses autres distributions normales généralisées .
la source
La dérivation de la distribution chi carré de la distribution normale est très analogue à la dérivation de la distribution gamma de la distribution exponentielle.
Nous devrions pouvoir généraliser ceci:
L'analogie est la suivante:
Les distributions normale et khi carré se rapportent à la somme des carrés
La distribution de densité conjointe de plusieurs variables distribuées normales standard indépendantes dépend de∑x2i
f(x1,x2,...,xn)=exp(−0.5∑ni=1xi2)(2π)n/2
SiXi∼N(0,1)
alors∑ni=1Xi2∼χ2(ν)
Les distributions exponentielles et gamma se rapportent à la somme régulière
La distribution de densité conjointe de plusieurs variables distribuées exponentielles indépendantes dépend de∑xi
SiXi∼Exp(λ)
alors∑ni=1Xi∼Gamma(n,λ)
La dérivation peut être effectuée par un changement de variables intégrant non pas sur tous les mais plutôt sur le terme sommé (c'est ce que Pearson a fait en 1900). Cela se déroule de manière très similaire dans les deux cas.x1,x2,...xn
Pour la :χ2
Où est le volume à n dimensions d'une n-boule de rayon carré .V(s)=πn/2Γ(n/2+1)sn/2 s
Pour la distribution gamma:
Où Est le volume à n dimensions d'un n-polytope avec .∑xi<sV(s)=snn! ∑xi<s
La distribution gamma peut être considérée comme le temps d'attente pour le ème événement dans un processus de Poisson qui est distribué comme la somme de variables distribuées exponentiellement.n nY n n
Comme Alecos Papadopoulos l'a déjà noté, il n'y a pas de connexion plus profonde qui fait des sommes de variables normales au carré «un bon modèle pour le temps d'attente». La distribution gamma est la distribution d'une somme de variables distribuées normales généralisées. Voilà comment les deux se rejoignent.
Mais le type de somme et le type de variables peuvent être différents. Alors que la distribution gamma, lorsqu'elle est dérivée de la distribution exponentielle (p = 1), obtient l'interprétation de la distribution exponentielle (temps d'attente), vous ne pouvez pas revenir en arrière et revenir à une somme de variables gaussiennes au carré et utiliser cette même interprétation.
La distribution de densité pour le temps d'attente qui diminue de façon exponentielle, et la distribution de densité pour une erreur gaussienne diminue de manière exponentielle (avec un carré). C'est une autre façon de voir les deux connectés.
la source