Théorème de la limite centrale pour les racines carrées des sommes des variables aléatoires iid

11

Intrigué par une question à math.stackexchange , et en l'examinant empiriquement, je me pose des questions sur l'énoncé suivant sur la racine carrée des sommes des variables aléatoires iid.

Supposons que sont des variables aléatoires iid avec une moyenne finie et une variance et . Le théorème de limite centrale dit lorsque augmente.X1,X2,,Xnμσ2Y=i=1nXiYnμnσ2 d N(0,1)n

Si , puis-je également dire quelque chose comme lorsque augmente?Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Par exemple, supposons que les Xi soient Bernoulli avec la moyenne p et la variance p(1p) , alors Y est binomial et je peux simuler cela dans R, disons avec p=13 :

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

ce qui donne approximativement la moyenne et la variance espérées pour Z

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

et un tracé QQ qui ressemble à de la gaussienne

qqnorm(Z)

entrez la description de l'image ici

Henri
la source
1
@MichaelM: Merci pour ces commentaires. J'avais commencé avec le non négatif, mais je pensais que le comportement asymptotique intuitif que vous décrivez permettait une généralisation à plus de distributions. Mes surprises ont été (a) la variance de la racine carrée de la somme tendant apparemment à une constante ne dépendant pas de et (b) l'apparition d'une distribution qui semble très proche de la gaussienne. Un contre-exemple serait le bienvenu, mais lorsque j'ai essayé d'autres cas qui semblaient initialement non gaussiens, l'augmentation de semblait encore ramener la distribution à un résultat de type CLT. n nXinn
Henry
Un corollaire de cela est la racine quadratique moyenne (ou moyenne quadratique) des variables aléatoires iid convenablement mises à l'échelle (multiplier par comme avec une moyenne arithmétique) converge également vers une distribution gaussienne à condition que le e moment de la la distribution sous-jacente est finie. 4n4
Henry
3
Juste un petit commentaire: la revendication est un cas particulier de la méthode Delta, voir Théorème 5.5.24 dans le livre "Inférence statistique" de Casella & Berger.
Michael M
@ Michael: Vous voyez peut-être quelque chose que je ne suis pas pour le moment, mais je ne pense pas que ce problème particulier rentre dans les hypothèses de la méthode Delta classique (par exemple, comme indiqué dans le théorème que vous référencez). Notez que ne converge pas dans la distribution (non trivialement sur ) et donc "appliquer la méthode Delta avec " ne satisfait pas aux exigences requises. Cependant, comme le montre la réponse de S. Catterall, elle fournit une heuristique utile qui conduit à la bonne réponse. R g ( y ) = YRg(y)=|y|
cardinal
(Je pense que vous pouvez adapter la preuve de la méthode Delta à des cas similaires à ceux ci-dessus afin de rendre pleinement rigoureuse l'heuristique susmentionnée.)
Cardinal

Réponses:

14

La convergence vers un gaussien est en effet un phénomène général.

Supposons que sont des variables aléatoires IID avec la moyenne et la variance , et définissez les sommes . Fixez un nombre . Le théorème central limite habituel nous dit que as , où est le cdf normal standard. Cependant, la continuité du cdf limitant implique que nous avons égalementμ > 0 σ 2 Y n = n i = 1 X i α P ( Y n - n μX1,X2,X3,...μ>0σ2Yn=i=1nXiαnΦP(Yn-nμP(Ynnμσnα)Φ(α)nΦP

P(Ynnμσnα+α2σ24μσn)Φ(α)
parce que le terme supplémentaire sur le côté droit de l'inégalité tend vers zéro. Réorganiser cette expression conduit à
P(Yn(ασ2μ+nμ)2)Φ(α)

En prenant des racines carrées et en notant que implique que , nous obtenons En d'autres termes, . Ce résultat démontre la convergence vers un gaussien dans la limite comme .P ( Y n < 0 )μ>0P (P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Est-ce à dire que est une bonne approximation de pour un grand ? Eh bien, nous pouvons faire mieux que cela. Comme le note @Henry, en supposant que tout est positif, nous pouvons utiliser , avec et l'approximation , pour obtenir l'approximation améliorée comme indiqué dans la question ci-dessus. Notez également que nous avons toujours carnμnE[|Yn|]nE[Yn]=nμE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 comme .n
S. Catterall réintègre Monica
la source
Vous devrez peut-être ajouter tant que pour obtenir mon résultatnμnμσ24μ0n
Henry
@Henry Vous pouvez remplacer par pour toute constante et cela ne changera pas la distribution limite, mais cela peut changer le degré auquel est une bonne approximation de pour un grand spécifique . Comment avez-vous trouvé ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S.Catterall réintègre Monica
Nous avons donc . En supposant que tout est positif, tandis que le dénominateur de suggère , et en combinant ces pistes à . Var(Z)=E[Z2](E[Z])2 E[Z2]=E[Y]=nμE[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ Var(Z)|Yn|nμσ/2μ E[ZVar(Z)σ24μE[Z]nμσ24μ
Henry
Ok, merci, j'ai essayé de couvrir cela dans ma réponse maintenant.
S.Catterall réintègre Monica