Pourquoi la forme fonctionnelle du 1er étage en 2SLS n'est-elle pas importante?

9

Dans une présentation faite aujourd'hui, l'orateur a fait cette affirmation. Il a déclaré que même si la première étape était mal spécifiée, les estimations de coefficient de la deuxième étape resteraient valables. En tant qu'étudiant modeste, je ne pouvais pas demander d'explication, alors maintenant je vous ai demandé votre aide!

Heisenberg
la source
1
Je crois comprendre que la seule chose que vous aimez est sur le point que vos x , soit la valeur prédite de la première étape, est décorrélé avec le terme d'erreur de la deuxième étape. Vos coefficients de première étape peuvent être biaisés ou produire des prédictions en dehors de l'intervalle d'unité, etc., mais cela n'induira pas de corrélation entre les valeurs prédites de votre variable endogène et le terme d'erreur de la deuxième étape. Je n'ai jamais vu de preuve de cela cependant, mais j'ai vu des explications dans ce sens, par exemple Imbens. x^
coffeinjunky
Si votre x est un mannequin, je serais d'accord. Si votre x est continu, je serais sceptique (même si je n'ai pas vu de preuve). Généralement, lorsque les gens parlent d'impartialité, leur point de départ suppose que le modèle linéaire est valide. Je veux dire, en général , ils cherchent à obtenir que de y = X ' β . Mais si y = X β est un modèle d'ordures, alors β ne répond pas à la question que vous présumez. (Je ne parle que de forme fonctionnelle, pas de forme distributionnelle)E[β^]=βy=Xβy=Xββ
generic_user

Réponses:

1

Parce que OLS n'est pas biaisé à la moyenne. À moins qu'elle ne soit dramatiquement incorrecte (biaisée), la forme fonctionnelle ne devrait pas vraiment avoir d'importance.

Cependant, une forme fonctionnelle médiocre peut entraîner des inexactitudes (convergence plus lente).

Un mauvais choix de forme fonctionnelle ne peut pas conduire à un biais variable omis. Seule l'omission d'une variable.

L'utilisation de g (x) au lieu de f (x) est une mauvaise forme fonctionnelle. L'utilisation de g (x) au lieu de g (x, y) est une variable omise.

RegressForward
la source
1
Une forme fonctionnelle incorrecte peut entraîner un biais variable omis, non?
Heisenberg
xx2x