Cela semble être un problème fondamental, mais je viens de me rendre compte que je ne sais pas comment tester l’égalité des coefficients de deux régressions différentes. Quelqu'un peut-il nous éclairer?
Plus formellement, supposons que j’ai exécuté les deux régressions suivantes: et où fait référence à la matrice de de la régression et au vecteur des coefficients de la régression . Notez que et sont potentiellement très différents, avec des dimensions différentes, etc. Je m'intéresse par exemple à savoir si .y 2 = X 2 β 2 + ε 2 X i i β i i X 1 X 2
Si ceux-ci venaient de la même régression, ce serait trivial. Mais comme ils viennent de différents pays, je ne sais pas trop comment le faire. Quelqu'un a-t-il une idée ou peut-il me donner des indications?
Mon problème en détail: ma première intuition a été de regarder les intervalles de confiance, et s’ils se chevauchent, je dirais qu’ils sont essentiellement les mêmes. Cette procédure ne vient toutefois pas avec la taille correcte du test (chaque intervalle de confiance individuel a , par exemple, mais leur examen conjoint n'aura pas la même probabilité). Ma "seconde" intuition était de réaliser un test t normal. C'est, prenez
où est pris comme valeur de mon hypothèse nulle. Cela ne prend cependant pas en compte l’incertitude d’estimation de et la réponse peut dépendre de l’ordre des régressions (que j’appelle 1 et 2). β 21
Ma troisième idée était de procéder comme dans un test standard pour l’égalité de deux coefficients de la même régression, c’est-à-dire que prendre
La complication est due au fait que les deux proviennent de régressions différentes. Notez que
Cela m'a amené à poser cette question ici. Ce doit être une procédure standard / test standard, mais je ne trouve rien qui soit suffisamment similaire à ce problème. Donc, si quelqu'un peut m'indiquer la procédure correcte, je vous en serais très reconnaissant!
la source
Réponses:
Bien que cette analyse ne soit pas courante, elle en est une d’intérêt. La réponse acceptée correspond à la façon dont vous avez posé votre question, mais je vais vous proposer une autre technique raisonnablement bien acceptée, qui peut ne pas être équivalente (je laisserai les meilleurs avis pour le commenter).
Cette approche consiste à utiliser le test Z suivant:
la source
Pour les personnes ayant une question similaire, laissez-moi vous donner un aperçu simple de la réponse.
Cela conduira à une matrice de variance-covariance qui permet de tester l'égalité des deux coefficients.
la source
expand =2, generate(indicator); generate y = cond(indicator, y2, y1); regress y i.indicator##c.X, vce(cluster id);
utilisation de comptes d’erreurs standard en cluster pour le fait que e1 et e2 ne sont pas indépendants pour la même observation après l’empilement du jeu de données.(Clogg, CC, E. Petkova et A. Haritou (1995). Méthodes statistiques pour comparer les coefficients de régression entre modèles. American Journal of Sociology, 100 (5), 1261-1293.) Présente une réponse dans le cas particulier d’équations imbriquées (c.-à-d. pour obtenir la deuxième équation, considérons la première et ajoutons quelques variables explicatives). Ils disent que c’est facile à mettre en œuvre.
Si je comprends bien, dans ce cas particulier, un test de Haussman peut également être mis en œuvre. La principale différence est que leur test considère comme vraie la deuxième équation (complète), alors que le test de Haussman considère comme vraie la première équation.
Notez que Clogg et al (1995) ne convient pas aux données de panel. Mais leur test a été généralisé par (Yan, J., Aseltine Jr, RH et Harel, O. (2013). Comparaison des coefficients de régression entre des modèles linéaires imbriqués pour des données en grappes et des équations d'estimation généralisées. Journal of Educational and Behavioral Statistics, 38 (2), 172-189.) Avec un paquet fourni dans R: geepack Voir: https://www.jstor.org/stable/pdf/41999419.pdf?refreqid=excelsior%3Aa0a3b20f2bc68223edb59e3254c234be&seq=1
Et (pour le paquet R): https://cran.r-project.org/web/packages/geepack/index.html
la source