Je viens de recevoir un rejet d'un journal économique. Parmi les raisons invoquées pour le rejet figurent:
les avantages de l'utilisation de la méthode semi-paramétrique ne sont pas clairement mis en évidence par rapport à d'autres techniques plus simples avec une identification claire des relations causales
Il est certainement possible que j'aurais pu mieux motiver la méthodologie auprès d'un groupe d'économistes qui s'en tiennent généralement à l'OLS. Mais ai-je violé "l'identification propre"? Veuillez juger par vous-même et faites-moi savoir ce que vous en pensez:
Ma principale équation d'estimation est est continu, et sont binaires. Je peux supposer à juste titre que ce qui revient à dire que le coefficient sur est non conditionnel aux variables factices au niveau individuel («effets fixes» en langage économétrique). Quand je continue inclure la variable , je cherche simplement à l' hétérogénéité des effets de traitement estimés sur des gradients de . Donc, l'effet causal moyen du traitement
Le modèle est estimé par des splines quadratiques pénalisées (par exemple: Ruppert et al. 2003). Plus précisément:
Ceci est résolu par
où inclut les termes paramétriques et les termes de noeud, et où la pénalité de crête s'applique uniquement aux termes de noeud et est choisie pour minimiser AIC. (Je ne peux pas rendre pleinement justice à la méthodologie - voir Ruppert et al, ou le manuel de Simon Wood sur GAM).
Bien sûr, j'utilise ces semi-paramètres car je ne veux pas imposer de formes fonctionnelles infondées à mes données. Cela fausserait tout naturellement mes estimations autant qu'imposer un ajustement logarithmique à une fonction sinusoïdale fausserait mes estimations. Mais y a-t-il quelque chose d'inhérent aux splines pénalisées telles que je les ai décrites qui rendrait par essence la déclaration suivante fausse?
la source
Réponses:
L '«identification propre» des paramètres de régression n'est pas un concept établi. Je crois que ce que le critique veut dire par là, c'est que vous devez spécifier un paramètre qui est interprétable, testable, de faible dimensionnalité, et pour lequel l'analyse est décemment alimentée pour détecter afin qu'une estimation impartiale puisse être obtenue avec une efficacité relativement bonne.
Le désir d'une «identification propre» n'implique pas que l'OLS soit le seul outil approprié pour le travail. OLS est, cependant, un outil théoriquement et pratiquement solide pour spécifier et estimer les paramètres dans une variété de paramètres. Le désir d'une "identification propre" n'exclut pas non plus l'inférence semi-paramétrique. Comme note, la spline étend un modèle OLS en créant (a) une ou des représentations complexes de covariables. L'inférence semi-paramétrique implique une modélisation flexible pour éliminer l'influence des statistiques auxiliaires, mais dans votre modèle, il semble que l'exposition principale soit gérée de cette manière.
Je pense que l'examinateur soulève deux préoccupations fondées. La première est la justification de la pénalisation. Les méthodes de régression pénalisées sont précieuses pour la prédiction. Ils sont rarement utilisés pour l'inférence. Les méthodes pénalisées comme la régression des crêtes sont biaisées et il est difficile de décrire ou d'évaluer le biais. Le but de minimiser l'AIC est d'obtenir les meilleures prédictions, et non une inférence valide. La deuxième préoccupation justifiée est de savoir si la spline est même nécessaire pour modéliser l'exposition principale. Il est vrai que vous dites qu'une spline est capable de modéliser des formes fonctionnelles non linéaires complexes. Cependant, une spline simplifie très peu. Il s'agit d'une représentation complexe de haute dimension, avec des nœuds et des réglages qui peuvent être une source de biais pour les chercheurs, et des covariables qui sont presque ininterprétables pour quiconque, sauf les statisticiens hautement qualifiés. De nombreuses tendances statistiquement significatives qui sont modélisées avec précision par des splines ont des approximations linéaires sous-jacentes qui ne sont ni statistiquement ni pratiquement significatives.
Si la forme fonctionnelle de l'exposition principale est mal spécifiée, il est possible d'utiliser les erreurs standard de Huber White pour obtenir une inférence cohérente et non biaisée pour la pente des moindres carrés comme approximation de premier ordre de toute tendance non linéaire. Les splines peuvent être utilisées pour modéliser des variables de précision, sur lesquelles vous ne basez pas d' inférence, lorsqu'il existe une conception complexe des données. Cela permet de faire correspondre et de réduire efficacement la variabilité lorsqu'il existe une hétérogénéité complexe dans les données.
Je pense que les commentaires des examinateurs peuvent être traités en ajustant un modèle linéaire pour l'exposition et en effectuant une inférence avec les erreurs de Huber White Sandwich. Si l'inférence est en grande partie d'accord avec l'inférence spline, commentez le modèle spline dans la mesure où il montre une tendance curviligne entre l'exposition et la réponse.
la source