Lee et Lemieux (p. 31, 2009) suggèrent au chercheur de présenter les graphiques lors de l'analyse de conception de discontinuité de régression (RDD). Ils suggèrent la procédure suivante:
"... pour une certaine largeur de bande , et pour un certain nombre de casiers et à gauche et à droite de la valeur de coupure, respectivement, l'idée est de construire des casiers ( , ], pour + , où "K 0 K 1 b k b k + 1 k = 1 , . . . , K = K 0 K 1 b k = c - ( K 0 - k + 1 ) ⋅ h .
c=cutoff point or threshold value of assignment variable
h=bandwidth or window width.
... puis comparez les résultats moyens juste à gauche et à droite du point de coupure ... "
..dans tous les cas, nous montrons également les valeurs ajustées à partir d'un modèle de régression quartique estimé séparément de chaque côté du point de coupure ... (p. 34 du même article)
Ma question est de savoir comment programmer cette procédure dans Stata
ou R
pour tracer les graphiques de la variable de résultat par rapport à la variable d'affectation (avec des intervalles de confiance) pour le RDD net. Un exemple d'échantillon Stata
est mentionné ici et ici (remplacer rd par rd_obs) et un échantillon exemple en R
est ici . Cependant, je pense que les deux n'ont pas mis en œuvre l'étape 1. Notez que les deux ont les données brutes avec les lignes ajustées dans les graphiques.
Exemple de graphique sans variable de confiance [Lee et Lemieux, 2009] Merci d'avance.
Réponses:
Est-ce très différent de faire deux polynômes locaux de degré 2, un pour en dessous du seuil et un pour au-dessus avec des points lisses aux ? Voici un exemple avec Stata:Kje
Alternativement, vous pouvez simplement enregistrer les valeurs lpoly lissées et les erreurs standard en tant que variables au lieu de les utiliserX s s e u l l l
twoway
. Au-dessous de est le bac, est la moyenne lissée, est l'erreur standard, et et sont les limites supérieure et inférieure de l'intervalle de confiance à 95% pour le résultat lissé.s s e u l l lComme vous pouvez le voir, les lignes du premier tracé sont les mêmes que dans le second.
la source
Voici un algorithme en conserve. Calonico, Cattaneo et Titiunik ont récemment proposé une procédure de sélection robuste de la bande passante. Ils ont implémenté leur travail théorique pour Stata et R , et il est également livré avec une commande de tracé. Voici un exemple dans R:
Cela vous donnera ce graphique:
la source