OLS en termes de moyens et de taille d'échantillon

8

Étant donné un modèle:

y=β0+β1F+u

Où est factice si femelle et sinon, y est hauteur en cm. La taille de l'échantillon est au total. Plus loin et . Calculez les estimations des paramètres.F=10nFemunele=nmunele=100200y¯munele=175y¯Femunele=165

Ma tentative:

En utilisant la formule bien connue:

β^=(XX)-1Xy
je reçois:
[200100100100]-1[170200165200]

Premièrement, les éléments dans (XX)-1 , puisque X n'est qu'un tas, il y a 100 femmes dans l'échantillon et il y a 200 hommes et femmes au total. Pour Xy , le premier élément est la "grande moyenne" de 170, et le second est juste la moyenne de l'échantillon de taille pour les femmes. Les deux sont mis à l'échelle par 200, car je n'ai pas "réduit" (XX)-1 .

Est-ce correct? Je demande, car la solution (lors de la multiplication) se traduit par des nombres (très) impairs.

Repmat
la source

Réponses:

7

L'approche est correcte, mais il y a une légère erreur numérique: il n'y a que femmes, pas . Les hauteurs moyennes pour les hommes et les femmes peuvent être converties en sommes via100200

Sum of male heights=100×175

et

Sum of female heights=100×165.

Par conséquent, la somme de toutes les hauteurs est

Sum of all heights=100×175+100×165=200×170,

comme indiqué dans la question. Par conséquent, les équations normales sont

(200100100100)(β^0β^1)=(200170100165)

( pas sur le côté droit), avec solution165200

(β^0,β^1)=(175,10).
whuber
la source
Quelle erreur idiote ...
Repmat
1
Je ne dirais pas que c'est idiot. C'est une chose naturelle à faire. J'ai dû fixer la question pendant quelques minutes avant que le problème ne devienne apparent ....
whuber
1

Je suis assez confus. Qu'est-ce que veux dire? S'agit-il de résidus? Si oui, alorsu

XX =[200100100100]

depuis

X=yβ=[y1β1y2β1...ynFβ1ynF+1β1ynF+2β1...ynnF+nmβ1y1β2y2β2...ynFβ2ynF+1β2ynF+2β2...ynnF+nmβ2]T

=

[11...111...100...011...1]T

Quelques idées:

Étant donné votre équation, devrait être de 175 et = -10. Donc, pour la partie masculine et féminine, vous obtenez:β1β2

fm=175(+)10×0+u=175+u

ff=175(+)10×1+u=165+u

Puisque vous pouvez utiliser

β=(XX)1XTy

à résoudre pour en utilisant le pseudoinverse de Moore-Penrose .β

((XX)1XT)+β=((XX)1XT)+[17510]=y

Maintenant contient:y

y[165f1165f2...165f100175m1175m2...175m100]T

J'espère que cela aide!

nali
la source
5
Alors que les statisticiens utilisent généralement sous le nom d'erreur pour la partie non expliquée du modèle, économètres parlent souvent de erreur, (transitoire) Chocs ou Perturbation. C'est juste une notation coutumière. ϵu
mugen
1
@nali, pouvez-vous ajouter un peu à cela? Compte tenu de vos chiffres, la solution du système n'a pas de sens. Et oui u est le (s) résiduel (s).
Repmat
@Repmat: J'ai mis à jour certaines réflexions que j'avais initialement. J'espère que cela aide.
nali
@Repmat: Vous m'avez peut-être mal compris. X '* y n'est pas [170 82,5] ^ T
nali