Jeux de données en libre accès pour l'enseignement de la régression IV

10

Je recherche un ensemble de données pour montrer (à un groupe d'ingénieurs) comment la technique des variables instrumentales est utilisée dans la pratique économétrique.

Je pourrais toujours créer mes propres données, mais je pense que cela pourrait être plus intéressant pour tout le monde d'utiliser des données réelles (pas trop compliquées) pour reproduire une étude réelle.


ps. Pardonnez-moi si c'est hors sujet pour ce site.

snoram
la source
C'est en fait une excellente question. Si vous trouvez une étude que vous aimez (sans données classifiées), vous pouvez contacter le ou les auteurs de l'étude et ils devraient vous fournir ces données et ce code sur demande. Cela peut prendre 2-3 semaines pour eux (ou pour vous) pour le nettoyer et vous contacter. La propreté des données brutes et du code peut varier considérablement d'un économiste à l'autre, mais la politique reste la même: nos résultats doivent être robustes à une enquête par des pairs.
RegressForward

Réponses:

8

Je peux recommander cet article comme exemple:

Les origines coloniales du développement comparatif: une enquête empirique

Daron Acemoglu, Simon Johnson et James A. Robinson

Cet exemple est célèbre non seulement grâce à l'utilisation créative des variables instrumentales, mais aussi en raison de la discussion ultérieure sur la validité des instruments.

Et des discussions pertinentes:

  • Bazzi, Samuel et Michael A. Clemens. "Instruments contondants: éviter les pièges courants dans l'identification des causes de la croissance économique." American Economic Journal: Macroeconomics 5, no. 2 (2013): 152–86.
  • Deaton, Angus. "Instruments, randomisation et apprentissage du développement." Journal of Economic Literature 48, no. 2 (2010): 424–55.

Deuxièmement,

Variables instrumentales et recherche d'identification: de l'offre et de la demande aux expériences naturelles

Angrist, Joshua D. et Alan B. Krueger

Nous discutons de la mécanique des variables instrumentales et des qualités qui font un bon instrument, en accordant une attention particulière aux instruments issus des «expériences naturelles».

Des exemples suivent.

Anton Tarasenko
la source
1
Ces sources sont très utiles, je les ai indiquées dans la page de discussion de la page ReplicationWiki pour cette méthode .
Jan Höffler
5

Par accès ouvert, entendez-vous un accès en ligne gratuit? La fréquentation scolaire obligatoire affecte-t-elle la scolarité et les gains? ( Angrist et Krueger (1991) ) utilise le mois de naissance comme instrument de réussite scolaire:

Cet article présente des preuves montrant que la saison de naissance des individus est liée à leur niveau de scolarité en raison des effets combinés de la politique sur l'âge de début de scolarité et des lois sur la fréquentation scolaire obligatoire. Dans la plupart des districts scolaires, les personnes nées au début de l'année commencent l'école à un âge légèrement plus avancé et ont donc le droit de quitter l'école après avoir terminé moins d'années de scolarité que les personnes nées vers la fin de l'année. Nos estimations suggèrent que jusqu'à 25% des décrocheurs potentiels restent à l'école en raison des lois sur la scolarité obligatoire. Nous estimons l'impact de la scolarité obligatoire sur les gains en utilisant le trimestre de naissance comme variable instrumentale de l'éducation dans une équation des gains. Cela fournit une stratégie d'identification valide car la date de naissance est peu susceptible d'être corrélée avec les déterminants des gains omis. L'estimation des variables instrumentales du taux de rendement de l'éducation est remarquablement proche de l'estimation des moindres carrés ordinaires, ce qui suggère qu'il y a peu de biais de capacité dans les estimations conventionnelles du rendement de l'éducation. Les résultats impliquent également que les individus qui sont obligés d'aller à l'école plus longtemps qu'ils ne le souhaitent par les lois sur la scolarité obligatoire récoltent un rendement substantiel pour leur scolarité supplémentaire.

Les auteurs mettent leurs données et le code Stata à disposition sur Internet sans restriction. Cela dit, cet instrument a des problèmes .

BKay
la source
"accès en ligne gratuit" exactement.
snoram
1

Dans le ReplicationWiki (que j'ai fondé), vous pouvez trouver du matériel de réplication pour de nombreuses méthodes. Un aperçu des études empiriques qui ont utilisé des variables instrumentales (IV) peut être trouvé ici . Il présente plus d'une centaine de jeux de données en accès libre pour l'enseignement de la régression IV. Vous pouvez également voir si des réplications sont déjà connues. Si vous ne voulez que des cas contenant des données et voir quel logiciel a été utilisé, vous pouvez utiliser le formulaire de recherche comme ici .

Il y a également des informations sur les réplications de deux études mentionnées ci-dessus: Un commentaire de 2012 sur "Les origines coloniales du développement comparatif: une enquête empirique" et une réponse , et une réplication d'une partie de l'étude susmentionnée "Est-ce que la fréquentation scolaire obligatoire Affecter la scolarité et les gains? (Angrist et Krueger (1991) . Il utilise une méthodologie différente.

Jan Höffler
la source
Merci, je vois votre point. Comme cela m'a aidé à trouver des informations supplémentaires sur une réponse qui était déjà fournie et n'était pas vraiment une réponse en soi, j'ai pensé que je devrais plutôt l'écrire comme un commentaire mais je l'ai fusionnée maintenant. L'autre commentaire a déjà été voté là où il est, alors je le laisse, j'espère que ça va. Je ne vois pas de quatrième mention.?
Jan Höffler
Ok, intégré celui-là aussi maintenant.
Jan Höffler
J'ai supprimé mes commentaires précédents car vous avez effectué les modifications demandées.
Giskard
1
+1: Dans son état actuel (13/02/16), cette réponse semble plutôt bonne. On dirait une très bonne ressource.
jmbejara