Papiers séminaux qui plus tard se sont avérés contenir des erreurs

37

Je lisais sur les institutions et je suis tombé sur un article d’Acemoglu, Johnson et Robinson (AJR) sur Les origines coloniales du développement comparé: une enquête empirique , et cet article semblait si «parfait» que de nombreux autres articles fondés sur les données du taux de mortalité des anciens colons et de la manière dont il a été utilisé par l’AJR en tant que facteur IV en raison de la qualité actuelle des institutions dans les anciennes colonies.

Cependant, alors que je commençais à chercher plus sur ce papier, j’ai découvert qu’il était en fait rempli d’erreurs, notamment en ce qui concerne le traitement des données. ( Commentaire d' Albouy sur le même article, publié en 2012 par The American Economic Review)

J'aimerais savoir si, outre ce document sur l'économie du développement, y a-t-il d'autres documents fondamentaux, dans aucun domaine de l'économie, qui se sont révélés ultérieurement avoir des erreurs cruciales qui ont invalidé les conclusions du document?

Un vieil homme à la mer.
la source
5
Que diriez-vous de faire comme pour les livres, une suggestion par réponse? Pour que les gens puissent voter individuellement.
FooBar
1
Notez que même dans le cas du document que vous citez comme étant "bourré d’erreurs", les auteurs originaux rejettent avec véhémence le commentaire de Albouy. Ils ouvrent leur réponse à son commentaire avec la citation extraordinaire "Tu viendras ici, mais pas plus loin". . De même avec la controverse plus célèbre et plus récente de Reinhart / Rogoff. Je ne suis au courant d'aucun article d'économie empirique dans lequel les auteurs originaux en seraient jamais arrivés à dire "OK, on ​​a tout gâché." Il y a des erreurs dans chaque article, mais aucun auteur n'a jamais admis que leur article contienne des erreurs fatales.
Kenny LJ
@KennyLJ Cette réponse est au premier commentaire d'Albouy, ce n'est pas au commentaire d'Albouy de 2012 publié par l'ARE.
Un vieil homme à la mer.
@Anoldmaninthesea: Veuillez consulter le contenu du numéro de l'ARE d'octobre 2012 et vous verrez que la réponse de l'AJR citée dans mon commentaire ci-dessus était en effet une réponse directe "au commentaire d'Albouy de 2012 publié par l'ARE".
Kenny LJ

Réponses:

29

Mon exemple préféré est la formulation initiale du théorème d'impossibilité d' Arrow dans la première édition de "Choix social et valeurs individuelles" de Arrows (1951). Dans la première édition, Arrow a affirmé que, avec 4 autres conditions , la condition de domaine suivante

`` Le domaine est suffisamment étendu pour qu'il existe au moins un triple d'alternatives libres. (Un triple est appelé gratuit si toutes les combinaisons possibles d'ordonnances individuelles de ce triple se produisent réellement dans "(reformulation de Blau (1957))D

implique qu'il n'existe aucune fonction de protection sociale , où est l'ensemble de tous les ordres possibles (relations binaires complètes et transitives) sur l'ensemble des alternatives .S:RRUNE

Blau (1957), L'existence de fonctions de bien-être social, a ensuite démontré que cela était faux . Econometrica, vol. 25, n ° 2 (avril 1957), p. 302-313, qui fournit un contre-exemple.

Blau a également montré (entre autres) que le théorème pouvait être corrigé en remplaçant la condition de domaine ci-dessus par la condition suivante

Domaine universel: le domaine de la fonction de bien-être social contient tous les profils de préférences possibles sur l'ensemble des alternatives (avec | A |3 ).UNE|UNE|3

Arrow a ensuite corrigé cette erreur dans la deuxième édition de Social Choice and Individual Values ​​(1963) , et la formulation du théorème d'Arrow utilisant la condition de domaine universel est désormais devenue la norme.

Ceci étant dit, l'erreur initiale dans la première édition du livre d'Arrow était plutôt mineure et la solution proposée par Blau ne réduit en rien l'importance du résultat et de l'approche de Arrow. Intuitivement, la conclusion reste que, dans un vaste domaine de problèmes économiques pertinents, aucune fonction de bien-être social ne satisfait à un ensemble de conditions plutôt fondamentales et raisonnables.

Donc, il se peut que ce ne soit pas exactement le type d'erreur que vous recherchiez (c'est certainement un document phare!), Mais j'aime tellement cet exemple que je n'ai pu résister à son envoi. Si des personnes aussi brillantes que Arrow commettent ce genre d’erreurs, cela supprime-t-il un peu la pression pour tous les autres?

Martin Van der Linden
la source
:) bel exemple.
Un vieil homme à la mer.
22

L'article fondamental de Kydland et Prescott sur la théorie de RBC utilise une spécification de journal de bord sur les préférences en matière de consommation et de loisirs, affirmant que c'est le seul qui corresponde à une part constante à long terme des heures de travail (l'un des faits de Kaldor).

C'est faux. En fait, il existe toute une classe de fonctions utilitaires à séparation additive (King-Rebelo-Plosser, découvertes (publiées) au cours de la même décennie) où les effets de revenu et de substitution du revenu du travail sont annulés et n’affectent pas la décision en matière de temps de travail.

UNEF(K,L)KUNE

Ne vous méprenez pas, c'est toujours un document très important, car c'est la base de la macro la plus moderne. Mais à l'époque, les gens s'étonnaient de la qualité des données fournies par RBC. Eh bien, si vous ne correspondez pas aux données sur le travail, le reste n’est pas surprenant.

FooBar
la source
19

Dans un article très influent d'Angrst et Krueger (1991), le trimestre de la naissance est utilisé comme un instrument pour l'effet de la scolarisation sur les gains. Étant donné que la scolarité obligatoire s'arrête à un certain âge (il y a tant d'abandons quand ils le peuvent). Cependant, il s'est avéré que le trimestre de la naissance n'est pas un bon instrument, en corrélation avec les antécédents familiaux et donc aussi les revenus.

http://web.stanford.edu/~pista/angrist.pdf

Editez à la demande de 'Un vieil homme à la mer': jetez un coup d'œil à un (Buckles et Hungerman, 2013), qui montrent clairement que la date de naissance est en corrélation avec la caractéristique de la mère. L'instrument ne satisfait donc pas l'hypothèse d'exogénéité (Edit2: les caractéristiques de la mère sont clairement corrélées au salaire).entrez la description de l'image ici

entrez la description de l'image ici

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3777829/

snoram
la source
1
Heureuse d'entendre cela. Pour mémoire, je pense que le travail d’Angrist et de Krueger est extraordinaire, mais aujourd’hui, nous savons mieux que d’utiliser le quart de naissance (au moins aux États-Unis et à cette fin) comme instrument. La science avance.
Snoram
15

Dans un article de 1929, Harold Hotelling a présenté ce qui est devenu le modèle standard de la concurrence spatiale. Deux entreprises se positionnent sur un intervalle, ce qui induit une certaine structure de la demande, puis se font concurrence sur les prix. Le modèle était influent et largement enseigné. Le message était que les entreprises diffèrent peu, les deux se situant au centre.

Mais en 1979 (!), Les journaux d’Aspremont, Gabszewicz et Thisse signalaient que le modèle n’avait en réalité aucun équilibre selon les spécifications originales de Hotelling. Il y a une discontinuité importante que Hotelling et tout le monde ont ensuite ignorée.

Michael Greinecker
la source
14

C'est gratuit, mais je vais l'attraper: Reinhard et Rogoff (2010, AER pp) fait valoir que le ratio dette publique / pib est critique à environ 90%, affirmant que les pays qui se heurtent à ce même niveau d'endettement pousser moins.

Ignorant tout le point de corrélation par rapport à la causalité, UMass student + coauthors [référence requise] a montré que ce résultat n’est valable que lorsque

  • En utilisant une méthode de pondération spécifique et controversée qui, iirc, n’a pas été soulignée dans leur document
  • Sélection d'échantillons spécifiques et controversés (comme ci-dessus)
  • Une erreur dans leurs calculs Excel qui a ignoré certaines des observations

Ce n'est que lorsque tous les trois coexistent, que l'on obtient les 90% comme niveau spécifique d'intolérance. Autrement, alors que des ratios dette / pib plus élevés pourraient être en corrélation avec une croissance plus faible, aucune étude n’a montré de rupture / discontinuité structurelle à 90%.

FooBar
la source
Je pense que quelque chose de similaire est arrivé au papier d’Alesina et Ardagna qui affirmait que l’austérité était en réalité expansionniste. Je me souviens de l'avoir lu sur le blog de Paul Krugman, mais je ne me souviens pas des détails.
Keshav Srinivasan
5
Je ne qualifierais pas le papier de Reinhard et Rogoff de papier "essentiel" ...
Notre ReplicationWiki répertorie un certain nombre de réplications de cette étude .
Jan Höffler
Je viens de corriger le commentaire que j'avais fait il y a quelques jours et que je supprimais maintenant pour suivre la règle selon laquelle il fallait révéler l'affiliation. L’une des réplications est ce qui a révélé l’erreur, et j’estime important de montrer que les problèmes ne sont pas toujours aussi clairs, il existe différentes vues et dans le wiki, vous trouvez les sources, ainsi que les réponses, pour pouvoir construire votre propre opinion. Vous avez écrit vous-même "référence nécessaire" ...
Jan Höffler
9

Donohue & Levitt, 2001 ont montré un lien de causalité entre le taux d'avortement et le taux de criminalité 20 ans plus tard. Lorsque l'avortement a été légalisé dans les années 1970, toute une génération de naissances non désirées a été évitée, entraînant une chute de la criminalité près de deux décennies plus tard, lorsque cette génération fantôme aurait atteint sa majorité.

L'avortement légalisé représente jusqu'à 50% de la baisse de la criminalité.

Le problème avec le papier était que les auteurs ne faisaient pas ce qu'ils avaient dit. Dans le cadre de leur analyse, ils ont soumis les données à une batterie de tests. Ils affirment avoir contrôlé divers effets qui, en fait, en raison d’une erreur de codage, ne l’ont pas été. The Economist l' explique comme le fait le Wall Street Journal .

Donohue et Levitt n'ont pas effectué le test qu'ils pensaient avoir - une "erreur de programmation informatique par inadvertance mais grave", selon MM. Foote et Goetz ... Corriger cette erreur réduit de moitié l'effet de l'avortement sur les arrestations, à l'aide des données originales , et les deux tiers utilisant des chiffres mis à jour.

Une autre erreur identifiée dans le document est qu’ils ont utilisé des totaux de taux d’arrestation au lieu d’une variable contrôlée par la population.

Ces erreurs déprécient considérablement la conclusion d'un document très important et controversé.

Jamzy
la source