Encore une autre question centrale du théorème de la limite

11

Soit une séquence de variables aléatoires de Bernoulli indépendantes avec Définissez Montrez que converge en distribution vers la variable normale standard Z lorsque n tend vers l'infini.{Xn:n1}

P{Xk=1}=1P{Xk=0}=1k.
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
SnBnZn

Ma tentative est d'utiliser le Lyapunov CLT, donc nous devons montrer qu'il existe un δ>0 tel que

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

Définissez donc δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
et
Bn3=(k=1n1k1k2)(k=1n1k1k2)

En évaluant les grands n sur l'ordinateur, il montre comment k=1nE|Xkk1|3 et Bn3 comme n . Mais Bn3 augmente plus rapidement que Bn2 donc k=1nE|Xkk1|3Bn30 . Quelqu'un peut-il m'aider à prouver cette convergence?

TiffanyButterfly
la source
7
Voici l'exemple 27.3 de Probabilité et mesure de Patrick Billingsley.
Zhanxiong

Réponses:

10

Il peut être instructif de démontrer ce résultat à partir des premiers principes et des résultats de base , en exploitant les propriétés des fonctions générant des cumulants (exactement comme dans les preuves standard du théorème central limite). Il nous faut comprendre le taux de croissance des nombres harmoniques généralisés pour Ces taux de croissance sont bien connus et facilement obtenus par comparaison avec les intégrales : ils convergent pour et divergent autrement logarithmiquement pour . s = 1 , 2 , . n 1 x - s d x s > 1 s = 1

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

Soit et . Par définition, la fonction de génération de cumul (cgf) de est1 k n ( X k - 1 / k ) / B nn21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

L'expansion en série du côté droit, obtenue à partir de l'expansion de autour de , prend la formez = 0log(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

Les numérateurs des fractions sont des polynômes en avec le terme principal . Parce que l'expansion du journal converge absolument pour , cette expansion converge absolument lorsquek j - 1 | - 1 + exp ( t / B n )kkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(Dans le cas où il converge partout.) Pour fixe et les valeurs croissantes de , la divergence (évidente) de implique que le domaine de convergence absolue devient arbitrairement grand. Ainsi, pour tout fixe et suffisamment grand , cette expansion converge absolument.k n B n t nk=1knBntn

Pour suffisamment grand , on peut donc additionner l'individu sur terme par terme en puissances de pour obtenir le cgf de ,ψ k , n k t S n / B nnψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

Prendre les termes dans les sommes sur un à la fois nous oblige à évaluer les expressions proportionnelles àk

b(s,j)=1Bnjk=1nks

pour et . En utilisant l'asymptotique des nombres harmoniques généralisés mentionnés dans l'introduction, il découle facilement dej3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

cette

b(1,j)(log(n))1j/20

et (pour )s>1

b(s,j)(log(n))j/20

à mesure que grandit. Par conséquent, tous les termes dans l'expansion de au-delà de convergent vers zéro, d'où converge vers pour toute valeur de . Puisque la convergence du cgf implique la convergence de la fonction caractéristique, nous concluons du théorème de continuité de Levy que rapproche d'une variable aléatoire dont le cgf est 2/2 : c'est la variable normale standard, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


Cette analyse révèle à quel point la convergence est délicate: alors que dans de nombreuses versions du théorème de la limite centrale, le coefficient de est (pour ), ici le coefficient est seulement : la convergence est beaucoup plus lente. En ce sens la séquence de variables standardisées "à peine" devient Normale.tjO(n1j/2)j3O(((log(n))1j/2)

Nous pouvons voir cette lente convergence dans une série de simulations. Les histogrammes affichent itérations indépendantes pour quatre valeurs de . Les courbes rouges sont des graphiques des fonctions de densité normale standard pour référence visuelle. Bien qu'il y ait évidemment une tendance graduelle à la normalité, même à (où est encore appréciable), il reste une non-normalité appréciable, comme en témoigne l'asymétrie (égal à dans cet échantillon). (Il n'est pas surprenant que l'asymétrie de cet histogramme soit proche de , car c'est précisément ce que le terme dans le cgf est.)105nn=1000(log(n))1/20.380.35(log(n))1/2t3

Figure: histogrammes pour n = 30, 100, 300, 1000

Voici le Rcode pour ceux qui souhaitent expérimenter davantage.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}
whuber
la source
6

Vous avez déjà une excellente réponse. Si vous souhaitez également compléter votre propre preuve, vous pouvez argumenter comme suit:

Puisque converge pour tout et diverge pour ( ici ), nous pouvons écrirek=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

Par le même argument,

Bn2=k=1n1k+O(1).

Par conséquent, et, ainsi,S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

c'est ce que nous voulions montrer.

ekvall
la source
2

D'abord, vos variables aléatoires ne sont pas distribuées de façon identique si les distributions dépendent de ;)k

De plus, je n'utiliserais pas votre notation comme:Bn

  • les majuscules sont généralement réservées aux variables aléatoires.
  • c'est juste la somme des variances, donc j'utiliserais une notation impliquant un symbole pour rendre cela évident.σ

Ensuite, concernant la question, je ne sais pas s'il s'agit d'un exercice ou d'une recherche et quels outils vous êtes autorisé à utiliser. Si vous n'essayez pas de re-prouver les théorèmes connus, je dirais simplement que c'est un théorème central limite pour les VR indépendants non identiquement distribués mais uniformément bornés et je l'appelle un jour. Je n'ai pas de bonne source à portée de main mais il ne devrait pas être trop difficile d'en trouver une, par exemple regardez /mathpro/29508/is-there-a-central-limit-theorem- for-bounded-non-identiquement distribué-aléatoire .

Edit: Mon mauvais, bien sûr, la condition uniformément limitée n'est pas suffisante, vous avez également besoin de

k=1nσk2
Adrien
la source