Économétrie: l'élasticité est-elle significative dans ma régression ou dans une régression?

13

Il y a quelques mois, j'ai effectué un stage dans cette organisation; et, comme cadeau de départ, j'ai décidé de passer ma dernière semaine, avec le temps libre dont je disposais, pour enquêter sur les facteurs qui affectent les salaires des enseignants. Un problème que j'ai rencontré avec les salaires des enseignants était que la distribution pour l'État donné était biaisée. J'ai eu beaucoup d'observations qui se sont accrochées à l'extrémité inférieure de l'échelle des salaires. J'ai essayé de résoudre ce problème en incorporant un indice de salaire comparable dans ma variable dépendante (le salaire des enseignants), mais les résultats que j'ai trouvés étaient complètement obsolètes pour la portée de mon projet. J'ai plutôt décidé d'enregistrer ma variable dépendante. C'était bien parce que maintenant mon salaire avait une distribution normale et il avait l'air parfait dans l'histogramme. Lorsque j'ai commencé à tester, je suis arrivé au point où il me restait une dernière variable indépendante, les déclarations de revenus fonciers. Le problème avec mon salaire normatif était également apparent dans mes observations de déclaration d'impôt foncier. J'avais une énorme asymétrie de numéros de déclaration de revenus fonciers vers l'extrémité inférieure du spectre. Donc, j'ai également enregistré cette variable et elle a tout de même réussi le test d'hypothèse nulle.

Je ne sais pas si c'est exactement correct, mais en comparant le changement d'une variable enregistrée à une autre variable enregistrée m'a donné l'élasticité. En supposant que cela est correct, mon équation de régression (quelque chose comme LogWages = B0 + B1 (LogPropertyTaxReturns)) montre l'élasticité entre les deux variables. Est-ce pourtant significatif? Si mon objectif était de voir quelle variable a le plus affecté les salaires des enseignants dans un comté donné de mon état, est-ce que montrer l'élasticité entre les deux variables est utile? Nous voulons augmenter les comtés avec les salaires des enseignants les plus bas pour augmenter leur niveau de vie, mais je crains d'avoir extrapolé si loin des vraies observations que mon équation de régression finale n'a aucun sens.

Edit: Une de mes plus grandes craintes est que j'aurais dû utiliser un modèle non linéaire pour montrer la relation. Je pense que forcer à la fois la variable dépendante et la variable indépendante à coopérer dans cette régression linéaire est trompeur d'une certaine manière.

econometrics elasticity wages rosenjcb
la source

1

C'est absolument significatif. Regardez la définition de l'élasticité. Vous disposez essentiellement d'informations sur la direction de la relation entre les salaires et PropertyTaxReturns. De plus, vous avez une mesure estimée de cette relation. Puisqu'il s'agit de Log-Log, le salaire changera de B1 pour cent pour un changement de un pour cent de la déclaration d'impôt foncier. Vous pouvez en faire une analyse chronologique pour le confirmer. En fait, il suffit de représenter graphiquement les salaires et la déclaration de revenus fonciers au fil du temps pour voir quelle est la relation. C'est un moyen basique qui ne tient pas compte des variables cachées et etc.

Koba

@Koba Merci d'avoir commenté si rapidement. Mais le problème n'est-il pas que l'élasticité change le long de la courbe? Mon plus grand regret est d'avoir forcé le modèle à être linéaire, forçant l'élasticité à être assez stable. En y repensant, il aurait peut-être été préférable d'avoir un modèle non linéaire pour refléter cette asymétrie dont je parlais.

rosenjcb

Il n'y a rien de mal à transformer les variables à l'aide de log, racine carrée, inverses ou d'autres méthodes. Vous ne forcez rien. Vous utilisez les transformations pour trouver la relation linéaire entre les variables. Parfois, c'est facile comme si vous utilisiez simplement y = b0 + b1 * x. D'autres fois, les variables sont liées linéairement de manière plus compliquée comme par exemple log (y) = b0 + b1 * (1 / x). La dernière fonction peut vous donner une bonne relation linéaire, mais elle est plus difficile à interpréter, donc moins vous pouvez utiliser de transformation, mieux c'est.

Koba

La fonction log-log est assez simple log (y) = b0 + b1 * log (x). B1 est précisément le pourcentage de variation de y pour 1% de variation de x dans votre analyse de la section transversale. Encore une fois, si vous avez ces données pour une certaine période de temps, vous pouvez simplement les représenter graphiquement pour voir la relation.

Koba

J'ai déjà enregistré des variables et effectué d'autres transformations pour mes modèles de régression. Je craignais juste que l'élasticité fasse semblant de se rencontrer. Bien que, en y repensant, le modèle était linéaire, il avait juste le problème d'avoir des variables dépendantes et indépendantes avec des distributions asymétriques.

rosenjcb

12

La réponse à la question est oui, elle est en effet significative (au moins mathématiquement parlant). Si vous estimez l'équation linéaire

W = β_{0} + β_{1} P T R,

$W = \beta_0 + \beta_1 PTR,$

$\beta_1=\frac{\partial W }{\partial PTR}$ $\beta_1$ $PTR$ $W$

l o g (W) = β_{0} + β_{1} l o g (P T R),

$log(W) = \beta_0 + \beta_1 log(PTR),$

$\beta_1=\frac{\partial W}{\partial PTR}\cdot\frac{PTR}{W}$

De manière générale, les transformations linéaires n'affectent que l'interprétation donnée aux coefficients, mais la validité de la régression elle-même (en termes économiques généraux) est donnée par les hypothèses du modèle et les phénomènes économiques analysés.

han-tyumi
la source

8

$Y = \alpha X^\beta$ $\ln Y = \ln \alpha + \beta \ln X$

Je suppose que votre question est de savoir si l'utilisation de cette forme fonctionnelle a du sens dans votre modèle particulier. C'est difficile à dire. Comme pour toute régression linéaire ordinaire, vous faites une hypothèse sur la forme fonctionnelle. Vous pouvez au moins y penser comme une approximation linéaire qui a plus de sens après la transformation log-log.

jmbejara
la source

7

$x$ $\alpha$ $\beta$ $F$

\log y_{i} = α + β \log x_{i} + \sum_{j = 2}^{S} γ_{j} χ_{j} + λ_{j} χ_{j} \log x_{i}

$\log y_i = \alpha + \beta \log x_i +\sum_{j=2}^S \gamma_j\chi_j +\lambda_j\chi_j\log x_i$

χ_{j}

$\chi_j$

γ

$\gamma$

λ

$\lambda$

Notez qu'en tant que représentation de la "vraie" décision sous-jacente, toutes les transformations qui entraînent une régression linéaire sont fausses. En fait, tous les modèles vont se tromper. La question est vraiment: la statistique que vous avez obtenue de ce modèle est-elle utile à votre problème ? Si votre étude se concentre sur la détermination d'un modèle sous-jacent, est-ce un moment qui vous dit quelque chose d'intéressant sur ce modèle plus profond? Si vous êtes davantage orienté vers les politiques, une approximation avec une élasticité constante vous rapprochera-t-elle suffisamment de la vérité selon laquelle de nouvelles améliorations ne sont pas pertinentes? Soit il est extrêmement difficile de répondre à des questions en tant qu'observateur extérieur. Mais si la seule alternative qui vous inquiète est l'élasticité variable, le type de test que j'ai décrit ci-dessus peut vous donner une certaine tranquillité d'esprit.

jayk
la source

4

Les autres réponses couvraient les principaux problèmes, je voudrais répondre à la "modification" faite par l'OP dans la question:

Edit: Une de mes plus grandes craintes est que j'aurais dû utiliser un modèle non linéaire pour montrer la relation. Je pense que forcer à la fois la variable dépendante et la variable indépendante à coopérer dans cette régression linéaire est trompeur d'une certaine manière.

On a tendance à oublier que "transformer une variable" conduit à une nouvelle variable , dont le comportement peut être totalement différent de "l'original". L'exemple le plus simple consiste à comparer les graphiques d'une variable et son carré.

Ainsi, en considérant les logarithmes naturels de vos variables, vous n'examinez plus la relation entre elles , mais une relation entre certaines fonctions d'entre elles.
Il est heureux que le concept mathématique de "logarithme" puisse être lié au concept d '"élasticité", qui décrit une relation entre les variations en pourcentage, ce que nous comprenons d'un point de vue économique et que nous pouvons interpréter et utiliser de manière significative.

Si l'on peut raisonnablement dire que les variables présentent une "relation linéaire dans les logarithmes", cela signifie que leurs niveaux (c'est-à-dire les variables réelles) ont une relation non linéaire:

\ln y \approx a + b \ln x \Rightarrow y \approx e^{a} + x^{b}

$\ln y \approx a+b\ln x \Rightarrow y \approx e^a + x^b$

Alors pourquoi ne pas estimer un modèle non linéaire?
Dans le principe (mathématique), il n'y a aucune raison de ne pas le faire. Certains problèmes pratiques sont les suivants:

1) Il existe trop de formes de relations non linéaires, il n'y a qu'une seule relation linéaire (structurellement parlant). Il s'agit de "frais de recherche" pour la spécification la plus adaptée.

2) La relation non linéaire obtenue peut ne pas avoir d' explication économique claire . Pourquoi c'est un problème? Parce que nous ne découvrons pas ici les "lois de la nature", inchangées à travers le temps et l'espace. Nous approchons un phénomène social. Avoir une approximation qui, de plus, ne peut être présentée que comme une formule mathématique, sans raisonnement économique qui la valide et la soutient, rend le résultat très mince.

3) L' estimation non linéaire est moins stable en ce qui concerne la mécanique de l'algorithme d'estimation.

Alecos Papadopoulos
la source

3

Je dirais que votre modèle dans ce cas ne semble pas significatif si votre " objectif était de voir quelle variable les salaires des enseignants les plus touchés dans un comté donné de mon état ". Vous venez de montrer quelle est la corrélation entre (les journaux de) salaires et les déclarations d'impôts fonciers. Vous devez au moins utiliser une régression multiple.

Bien sûr, vous pouvez continuer et développer une stratégie d'identification à part entière et appropriée avec les outils méthodologiques appropriés afin d'estimer l'intensité de chaque effet causal et de trouver le plus grand ... En réalité, vous ne pourrez probablement pas pour le faire étant donné la complexité d'une telle tâche. C'est juste un continuum de raffinements et vous êtes près du modèle le plus grossier possible utilisé pour expliquer les salaires, très loin de ce que je considérerais comme les approximations acceptables d'une réponse à la question implicite dans votre objectif. Vous devriez essayer d'obtenir l'aide d'un économétricien.

s_a
la source

Économétrie: l'élasticité est-elle significative dans ma régression ou dans une régression?

Réponses: