Je voudrais demander - j'utilise logit pour rechercher si certaines variables améliorent le risque de crise monétaire. J'ai des données annuelles de 1980 pour de nombreux pays (panel déséquilibré), la variable muette est 1 si les crises monétaires ont commencé (selon ma définition), 0 sinon. Les variables explicatives sont selon certaines théories, comme le compte courant / PIB, les avoirs extérieurs nets / PIB, les prêts / PIB et ainsi de suite ... Tous sont décalés (-1). J'utilise des erreurs standard robustes, qui devraient être cohérentes avec l'hétéroskédasticité. Cependant, par exemple, les prêts au PIB ou NFA / PIB ne sont pas stationnaires (test de panel). Est-ce important? Je n'ai vu aucun test papier pour la stationnarité effectuer logit / probit. Pour moi, il est également intuitif que cela n'a pas d'importance. Si je teste si une variable augmente le risque de crise, cela ne devrait pas poser de problème, que cette variable augmente en permanence. Au contraire - une variable croissante augmente en permanence le risque de crise et lorsqu'elle atteint un niveau insoutenable, la crise se produit. Pourriez-vous me donner une réponse, si j'ai raison?
8
Réponses:
Quel que soit le modèle que vous utilisez, les principes fondamentaux de la théorie économétrique doivent être vérifiés et respectés. Les chercheurs se pavanent sur leur utilisation de modèles très sophistiqués, mais souvent - plus ou moins volontairement - ils oublient les fondamentaux de l'économétrie; ils deviennent donc assez ridicoles. L'économétrie n'est rien d'autre qu'une estimation de la moyenne et de la variance de vos paramètres, mais si la moyenne, la variance et la covariance de vos variables changent au fil du temps, des dispositifs et une analyse appropriés doivent être effectués. À mon avis, les modèles probit / logit avec des données non stationnaires n'ont aucun sens parce que vous voulez ajuster le côté droit de votre équation (qui est non stationnaire) dans le côté gauche qui est une variable binaire. La structure de la dynamique temporelle de vos variables indépendantes doit être cohérente avec celles dépendantes. Si certains de vos régresseurs ne sont pas stationnaires, vous spécifiez mal votre relation; en effet il faut que la combinaison de vos régresseurs soit immobile. Je pense donc que vous devrez probablement effectuer une régression en deux étapes. Dans la première, vous trouvez une relation stationnaire de vos variables, puis vous mettez cette relation dans votre modèle probit / logit et estimez un seul paramètre.
Évidemment, dans la première étape, vous devez avoir à la liste deux variables intégrées (dans le cas de la cointégration) ou au moins deux variables avec le même type de tendance. Si ce n'est pas le cas, vous avez un problème de variables omises.
L'alternative à tout cela est que vous changez la portée de votre analyse et transformez tous vos régresseurs en régresseurs stationnaires.
la source
Je suggère de regarder les résultats dans Chang Jiang Park (2006) et Park, Phillips (2000) . * Selon le premier article, les estimateurs logit sont cohérents même dans le cas de séries intégrées (théorème 2 à la page 6-7) et habituelles Les statistiques t peuvent être utilisées pour les paramètres d'intérêt dans votre cas (les coefficients sur les régresseurs). D'autres articles des mêmes auteurs développent une théorie économétrique pour d'autres cas de processus non stationnaires dans des modèles non linéaires.
* Ces articles ne traitent que de la théorie, je ne suis malheureusement pas en mesure de trouver un exemple d'un article empirique mentionnant réellement la question de la non-stationnarité dans ce contexte.
la source
Je sais que ce post est ancien mais les gens font des recherches et utilisent souvent ce truc comme référence.
Restons simples. Ayons un modèle de probabilité individuelle de défaut de paiement sur une hypothèque comme notre Y. Permet maintenant d'exécuter le PIB de niveau sur elle. Disons que vos données sont de 2002 à 2017, trimestrielles. Vous avez des millions d'observations qui au temps T partagent toutes les mêmes variables économiques. Je choisis cette période pour une bonne raison.
Qu'obtiendrez-vous en tant que relation? Oh mec, vous constaterez que shazaam, un PIB plus faible est corrélé à des valeurs par défaut plus élevées. Ça a l'air bien non?
Mais permet maintenant de prévoir cela, disons 50 ans (pour le plaisir). Prenez le PIB attendu au taux de croissance historique, disons 2%, et extrapolez le PIB. Exécutez maintenant la prévision. Que trouvez-vous? Shazaam, comme par magie, la probabilité de défaut tendra vers 0%.
Vous obtiendriez le contraire si vous choisissez le nombre total de chômeurs (pas le taux). Vous trouverez ce shazaam, le prévoir à l'avenir et la probabilité de tendances par défaut à 100%.
Les deux sont ridicules. Et voici le kicker. Si vous avez fait un test stationnaire sur certains de ces délais, vous constaterez qu'ils sont stationnaires. La raison en est que vous pouvez découper une série non stationnaire en parties stationnaires. En particulier parce que le PIB réel a augmenté, diminué et augmenté au cours de la période.
Oui, votre ajustement d'échantillon aura fière allure. Mais vos prévisions n'auront aucun sens.
Je le constate fréquemment dans la modélisation des métriques de risque.
la source
Vous êtes clairement bien d'un point de vue théorique. C'est une compréhension erronée des séries non stationnaires qu'elles ont des moyens changeants. Ils n'ont aucun moyen. La moyenne de l'échantillon est un nombre aléatoire car elle ne converge en aucun point et semble donc changer. Ce n'est pas non plus un problème pour logit ou probit.
Les modèles statistiques sont des mappages et il n'y a aucune raison pour laquelle on ne peut pas encapsuler une série non liée dans une série bornée. Par exemple, la vraie ligne numérique est normalement considérée comme n'ayant aucune longueur, mais l'enroule autour d'un cercle avec le pôle sud étant 0 et le pôle nord étant et pour un cercle unitaire, la ligne numérique entière a maintenant une longueur .∞ π
En mappant une série non stationnaire à un ensemble bien délimité, vous avez créé un problème bien délimité car la solution ultime doit correspondre à l'intervalle [0,1].
Tous les ratios comptables doivent être dépourvus d'écart et tous les rendements financiers doivent être dépourvus d'écart. Voir l'article à https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2828744
Vous n'avez pas à vous soucier intrinsèquement des erreurs robustes. C'est un malentendu des séries non stationnaires qu'elles sont hétéroskédastiques. Ils ne sont pas; ils sont demandés parce qu'ils n'ont aucun moyen de former une variance à propos en premier lieu, c'est donc encore une fois un nombre aléatoire. La structure des termes d'erreur a plus à voir avec le modèle qui mappe que le manque de stationnarité.
Là où vous pourriez faire face à un problème, c'est avec le concept de covariance. La distribution des rendements des actions provient d'une distribution qui n'a pas de matrice de covariance. Ce n'est pas que les stocks ne peuvent pas venir, mais ils ne peuvent pas convoiter. La même chose est vraie pour les économies. C'est un concept plus complexe que la covariance qui est une relation simple. Vous voudrez lire le document ci-dessus et réfléchir attentivement à vos relations de modèle.
la source