Une version très simple du théorème central limité comme ci-dessous qui est Lindeberg – Lévy CLT. Je ne comprends pas pourquoi il y a un sur le côté gauche. Et Lyapunov CLT dit mais pourquoi pas ? Quelqu'un pourrait-il me dire quels sont ces facteurs, tels que \ sqrt {n} et \ frac {1} {s_n} ? comment pouvons-nous les obtenir dans le théorème?
central-limit-theorem
intuition
Cochon volant
la source
la source
Réponses:
Belle question (+1) !!
Vous vous souviendrez que pour les variables aléatoires indépendantesX et Y , Var(X+Y)=Var(X)+Var(Y) et Var(a⋅X)=a2⋅Var(X) . Donc la variance de ∑ni=1Xi est ∑ni=1σ2=nσ2 , et la variance de X¯=1n∑ni=1Xi est nσ2/n2=σ2/n .
Ceci est pour la variance . Pour normaliser une variable aléatoire, vous la divisez par son écart-type. Comme vous le savez, la valeur attendue de est , donc la variable μX¯ μ
N(0,
En ce qui concerne votre deuxième point, je pense que l’équation présentée ci-dessus montre que vous devez diviser par et non pas pour standardiser l’équation, en expliquant pourquoi vous utilisez (l’estimateur de et non .√σ snσ) √σ−−√ sn σ) sn−−√
Ajout: @whuber suggère de discuter du pourquoi de la mise à l'échelle par . Il le fait là- bas , mais comme la réponse est très longue, je vais essayer de saisir l'essentiel de son argument (qui est une reconstruction des pensées de de Moivre).n−−√
Si vous ajoutez un grand nombre de +1 et de -1, vous pouvez approximer la probabilité que la somme soit par comptage élémentaire. Le log de cette probabilité est proportionnel à . Donc, si nous voulons que la probabilité ci-dessus converge vers une constante lorsque augmente, nous devons utiliser un facteur de normalisation dans .j - j 2 / n n O ( √n j −j2/n n O(n−−√)
En utilisant des outils mathématiques modernes (post de Moivre), vous pouvez voir l’approximation mentionnée ci-dessus en remarquant que la probabilité recherchée est:
que nous approchons par la formule de Stirling
la source
Il existe une belle théorie sur le type de distributions pouvant limiter les distributions des sommes de variables aléatoires. La ressource intéressante est le livre suivant de Petrov, que j'ai personnellement énormément apprécié.
Il s'avère que si vous étudiez les limites de ce type où sont des variables aléatoires indépendantes, les distributions des limites sont seulement certaines distributions.X i
Il y a beaucoup de mathématiques qui circulent alors, qui se résument à plusieurs théorèmes qui caractérisent complètement ce qui se passe dans la limite. Un de ces théorèmes est dû à Feller:
Théorème Soit une séquence de variables aléatoires indépendantes, la fonction de distribution de et une séquence de constante positive. Afin queV n ( x ) X n a n{Xn;n=1,2,...} Vn(x) Xn an
et
il est nécessaire et suffisant que
et
Ce théorème vous donne alors une idée de ce à quoi devrait ressembler.an
La théorie générale dans le livre est construite de telle manière que la constante de normalisation soit restreinte de quelque manière que ce soit, mais les théorèmes finaux qui donnent les conditions nécessaires et suffisantes ne laissent aucune autre place pour la constante de normalisation que .n−−√
la source
s représente l'écart type de l'échantillon pour la moyenne de l'échantillon. s est la variance de l'échantillon pour la moyenne de l'échantillon et égale à S / n. Où S est l'estimation de l'échantillon de la variance de la population. Puisque s = S / √n, cela explique comment √n apparaît dans la première formule. Notez qu'il y aurait un σ dans le dénominateur si la limite étaitn 2 n 2n n 2 n 2 2 n nn 2 n n
N (0,1) mais la limite est donnée par N (0, σ ). Puisque S est une estimation cohérente de σ, il est utilisé dans la deuxième équation pour extraire σ de la limite.n2 n
la source
Intuitivement, si pour un certain nous devrions nous attendre à ce que soit à peu près égal à ; cela semble être une attente plutôt raisonnable, bien que je ne pense pas que ce soit nécessaire en général. La raison pour laquelle dans la première expression est que la variance de va à comme et que donc gonfle la variance de sorte que la variance de l'expression soit égale à . Dans la deuxième expression, le terme est défini comme étantσ 2 Var ( Z n ) σ 2 √Zn→N(0,σ2) σ2 Var(Zn) σ2 ˉ X n-μ0 1n−−√ X¯n−μ 0 √1n σ2sn √n−−√ σ2 sn ∑ni=1Var(Xi)−−−−−−−−−−−√ tandis que la variance du numérateur augmente comme , nous avons donc à nouveau que la variance de l'expression entière est une constante ( dans ce cas).1∑ni=1Var(Xi) 1
Essentiellement, nous savons que quelque chose "d’intéressant" se produit avec la distribution de , mais si nous ne centrons pas correctement l’échelle, nous ne pourrons pas le voir. J'ai entendu dire que cela nécessitait parfois de régler le microscope. Si nous ne explosons pas (par exemple) par alors nous avons simplement dans la distribution par la loi faible; un résultat intéressant en soi, mais pas aussi informatif que le CLT. Si nous gonflons avec tout facteur dominé par , nous obtenons toujours tandis que tout facteur qui domine ˉ X -μ√X¯n:=1n∑iXi X¯−μ ˉ X n-μ→0an √n−−√ X¯n−μ→0 an n−−√ an(X¯n−μ)→0 an n−−√ donne . Il s'avère que est juste le bon grossissement pour pouvoir voir ce qui se passe dans ce cas (note: toute convergence ici est dans la distribution; il existe un autre niveau de grossissement intéressant pour une convergence presque sûre, qui donne loi du logarithme itéré).an(X¯n−μ)→∞ n−−√
la source