Erreurs normalement distribuées et théorème central limite

9

Dans l'économétrie d'introduction de Wooldridge, il y a une citation:

L'argument justifiant la distribution normale des erreurs fonctionne généralement comme ceci: parce que est la somme de nombreux facteurs non observés différents affectant , nous pouvons invoquer le théorème de la limite centrale pour conclure que a une distribution normale approximative.y uuyu

Cette citation se rapporte à l'une des hypothèses du modèle linéaire, à savoir:

uN(μ,σ2)

u est le terme d'erreur dans le modèle de population.

Maintenant, pour autant que je sache, le Central Limit Theorem déclare que la distribution de

Zje=(Ouije¯-μ)/(σ/n)

(où Ouije¯ sont des moyennes d'échantillons aléatoires tirés de n'importe quelle population avec une moyenne μ et une variance σ2 )

s'approche de celle d'une variable normale standard comme n .

Question:

Aidez-moi à comprendre comment la normalité asymptotique de Zje implique uN(μ,σ2)

OIE
la source

Réponses:

13

Cela peut être mieux apprécié en exprimant le résultat de CLT en termes de sommes de variables aléatoires iid. On a

nX¯-μσN(0,1)asymptotiquement

Multipliez le quotient par et utilisez le fait que pour obtenir Var(cX)=c2Var(X)σnVuner(cX)=c2Vuner(X)

X¯-μN(0,σ2n)

Maintenant, ajoutez au LHS et utilisez le fait que pour obtenirE [ a X + μ ] = a E [ X ] + μμE[uneX+μ]=uneE[X]+μ

X¯=1nje=1nXjeN(μ,σ2n)

Enfin, multipliez par et utilisez les deux résultats ci-dessus pour voir quen

je=1nXjeN(nμ,nσ2)

Et qu'est-ce que cela a à voir avec la déclaration de Wooldridge? Eh bien, si l'erreur est la somme de nombreuses variables aléatoires iid, elle sera distribuée approximativement normalement, comme on vient de le voir. Mais il y a un problème ici, à savoir que les facteurs non observés ne seront pas nécessairement distribués de manière identique et qu'ils pourraient même ne pas être indépendants!

Néanmoins, le CLT a été étendu avec succès à des variables aléatoires indépendantes non distribuées de manière identique et même à des cas de légère dépendance, dans certaines conditions de régularité supplémentaires. Ce sont essentiellement des conditions qui garantissent qu'aucun terme dans la somme n'exerce une influence disproportionnée sur la distribution asymptotique, voir aussi la page wikipedia sur le CLT . Vous n'avez bien sûr pas besoin de connaître ces résultats; Le but de Wooldridge est simplement de fournir de l'intuition.

J'espère que cela t'aides.

JohnK
la source
J'ajouterais (puisque l'auteur étudie l'économétrie) que dans son domaine d'étude, beaucoup de variables aléatoires (du moins celles utilisées pour la modélisation) n'ont pas défini de premiers moments, comme la distribution de Cauchy. Le CLT n'est donc pas celui sur lequel vous pouvez compter.
Demidov allemand