L'économétrie d'une approche bayésienne de la méthodologie d'étude d'événements

11

Les études d'événement sont très répandues en économie et en finance pour déterminer l'effet d'un événement sur le cours d'une action, mais elles sont presque toujours basées sur un raisonnement fréquentiste. Une régression OLS - sur une période de référence distincte de la fenêtre d'événement - est généralement utilisée pour déterminer les paramètres requis pour modéliser le rendement normal d'un actif. On détermine ensuite la signification statistique des retours anormaux cumulés ( ) sur l'actif suite à un événement pendant une fenêtre d'événement spécifiée de à . Un test d'hypothèse est utilisé pour déterminer si ces rendements sont significatifs et donc effectivement anormaux ou non. Donc:i T 1 T 2CARiT1T2

H0:CARi=0 , où

CARi=t=T1T2ARi,t=t=T1T2(ri,tE[ri,t]) , et

E[ri,t] est le rendement de l'actif prévu par le modèle.

Si notre nombre d'observations est suffisamment grand, nous pouvons supposer une normalité asymptotique de la distribution des rendements des actifs, mais cela peut ne pas être vérifié pour un échantillon de plus petite taille.

On peut faire valoir que pour cette raison, les études sur une seule entreprise et sur un seul événement (comme cela est requis par exemple dans les litiges) devraient suivre une approche bayésienne, car l'hypothèse d'une infinité de répétitions est beaucoup plus "loin d'être vérifiée" que dans le cas de plusieurs entreprises. Pourtant, l'approche fréquentiste reste une pratique courante.

Compte tenu de la faible littérature sur ce sujet, ma question est de savoir comment aborder au mieux une étude d'événement - analogue à la méthodologie décrite ci-dessus et résumée dans MacKinlay, 1997 - en utilisant une approche bayésienne.

Bien que cette question se pose dans le contexte de la finance d'entreprise empirique, elle concerne en réalité l'économétrie de la régression et de l'inférence bayésienne, et les différences de raisonnement derrière les approches fréquentistes et bayésiennes. Plus précisément:

  1. Comment devrais-je aborder au mieux l'estimation des paramètres du modèle en utilisant une approche bayésienne (en supposant une compréhension théorique des statistiques bayésiennes, mais peu ou pas d'expérience de son utilisation pour la recherche empirique).

  2. Comment puis-je tester la signification statistique, une fois que les rendements anormaux cumulatifs ont été calculés (en utilisant les rendements normaux du modèle)?

  3. Comment cela peut-il être implémenté dans Matlab?

Constantin
la source
1
(1.) est simple: utilisez la régression linéaire bayésienne . (2.) est plus délicat, car les tests de signification ne sont pas une chose bayésienne. La seule chose que vous pouvez faire est de comparer la probabilité de différents modèles, et n'est pas la base d'un modèle car n'est pas un paramètre de modèle. Quel est le but du ? Quelles décisions sont prises sur cette base? VOITURE VOITURECAR=0CARCAR
Andy Jones
Je recherche des preuves à l'appui de mon hypothèse selon laquelle l'événement examiné a une influence sur le prix de l'action (auquel cas la est différente de zéro, car elle est calculée pendant la fenêtre d'événement, par rapport au rendement normal, qui calculé pour la période de référence avant l'événement). Je voudrais savoir si les données corroborent l'hypothèse selon laquelle il existe effectivement une non nulle et également dans son ampleur. Je me rends compte que la signification statistique n'est pas vraiment une chose dans les statistiques bayésiennes, mais quelle interprétation cette méthode offre-t-elle? Puis-je appliquer un équivalent de test d'hypothèse? C A RCARCAR
Constantin
2
Si vous voulez faire valoir que l'approche bayésienne est plus applicable à de petits échantillons de taille , alors il est inévitable qu'avant parlera beaucoup trop fort avec un tel échantillon. n=1
StasK
Puis-je utiliser un préalable non informatif?
Constantin

Réponses:

5

Comme mentionné dans les commentaires, le modèle que vous recherchez est la régression linéaire bayésienne . Et puisque nous pouvons utiliser BLR pour calculer la distribution prédictive postérieure pour tout temps , nous pouvons évaluer numériquement la distribution .t p ( événement CAR | D , D ref )p(rt|t,Dref)tp(CAR|Devent,Dref)

Le fait est que je ne pense pas qu'une distribution sur soit vraiment ce que vous voulez. Le problème immédiat est que a une probabilité nulle. Le problème sous-jacent est que la "version bayésienne des tests d'hypothèse" compare les modèles via leur facteur Bayes , mais cela nécessite de définir deux modèles concurrents. Et ne sont pas des modèles (ou du moins, ce ne sont pas des modèles sans jonglage de nombres extrêmement contre nature).p ( CAR = 0 | événement D , D ref ) CAR = 0 , CAR 0CARp(CAR=0|Devent,Dref)CAR=0,CAR0

D'après ce que vous avez dit dans les commentaires, je pense que vous voulez vraiment répondre

Sont et mieux expliqué par le même modèle ou par différents ceux?D événementDrefDevent

qui a une réponse bayésienne soignée: définir deux modèles

  • D ref , D événement p ( D ref , D événement | M 0 )M0 : toutes les données dans sont tirées du même BLR. Pour calculer la probabilité marginale de ce modèle, vous devez calculer la probabilité marginale d'un ajustement BLR à tous les données.Dref,Deventp(Dref,Devent|M0)

  • D ref D événement p ( D ref , D événement | M 1 ) D ref D événementM1 : les données dans et sont tirées de deux BLR différents. Pour calculer la vraisemblance marginale de ce modèle, vous adaptez les BLR à et indépendamment (en utilisant les mêmes hyperparamètres!), puis prenez le produit des deux vraisemblances marginales BLR.DrefDeventp(Dref,Devent|M1)DrefDevent

Cela fait, vous pouvez ensuite calculer le facteur Bayes

p(Dref,Devent|M1)p(Dref,Devent|M0)

pour décider quel modèle est plus crédible.

Andy Jones
la source
Je ne pense pas qu'un modèle distinct pour la période de l'événement serait directement applicable à ma question de recherche particulière, car il n'y a pas d'autre facteur de risque que je pourrais ajouter pour expliquer le retour pendant la fenêtre de l'événement. Je considère l'événement comme une perturbation par rapport au rendement normal de mon modèle de tarification des actifs, il n'est donc pas vraiment possible de comparer deux modèles. N'est-il pas possible de construire un intervalle de confiance pour la ? De cette façon, je pourrais examiner si 0 se situe dans un certain intervalle autour de l'estimation ML, non? CAR
Constantin
La variante bayésienne des intervalles de confiance est un intervalle crédible , et oui, vous pouvez utiliser la distribution pour en construire un. Ce n'est pas un test d'hypothèse cependant. CAR
Andy Jones
1
Je pense que j'aurais peut-être mal expliqué le même modèle / les différents modèles - ci-dessus, ce que je voulais dire par "modèle différent" était "différents paramètres". Dans , un ensemble de paramètres est utilisé pour expliquer toutes les données. Dans , un ensemble de paramètres est utilisé pour expliquer les données d'apprentissage et un autre pour expliquer les données de test. Il s'agit d'une comparaison équitable car bien que ait deux fois plus de paramètres qu'il puisse ajuster aux données (augmentant sa probabilité marignale), il tire deux fois plus de paramètres de l'a priori (ce qui pénalise sa probabilité marginale). M 1 M 1M0M1M1
Andy Jones
D'accord, je comprends le concept. Cela semble vraiment élégant. Comment spécifier exactement les deux modèles? Pourriez-vous recommander de la littérature ou des concepts connexes à étudier spécifiquement?
Constantin
1
Bien qu'il soit controversé, il existe un test d'hypothèse nulle ou pointue bayésienne. Il s'agit simplement du rapport de cotes simple avec un a priori discontinu à . Ceci est controversé car la plupart des modèles ne donnent pas une bonne justification pour un mélange de priors continus et discrets. Les études d'événements sont une exception possible à cette règle. CARi=0
jayk
2

Vous ne pouvez pas faire d'étude d'événement avec une seule entreprise.

Malheureusement, vous avez besoin de données de panel pour toute étude d'événement. Les études d'événements se concentrent sur les retours pour des périodes individuelles avant et après les événements. Sans plusieurs observations fermes par période de temps avant et après l'événement, il est impossible de distinguer le bruit (variation spécifique de l'entreprise) des effets de l'événement. Même avec seulement quelques entreprises, le bruit dominera l'événement, comme le souligne StasK.

Cela étant dit, avec un panel de nombreuses entreprises, vous pouvez toujours faire du travail bayésien.

Comment estimer les rendements normaux et anormaux

Je vais supposer que le modèle que vous utilisez pour les rendements normaux ressemble à un modèle d'arbitrage standard. Si ce n'est pas le cas, vous devriez être en mesure d'adapter le reste de cette discussion. Vous voudrez augmenter votre régression de retour "normale" avec une série de variables muettes pour la date par rapport à la date de l'annonce, :S

rit=αi+γtS+rm,tTβi+eit

EDIT: Il devrait être que n'est inclus que si . Un problème avec ce problème avec cette approche est que sera informé par les données avant et après l'événement. Cela ne correspond pas précisément aux études d'événement traditionnelles où les rendements attendus sont calculés uniquement avant l'événement. s > 0 β iγss>0βi

Cette régression vous permet de parler de quelque chose de similaire au type de série CAR que nous voyons habituellement, où nous avons un graphique des rendements anormaux moyens avant et après un événement avec peut-être quelques erreurs standard autour:

entrez la description de l'image ici

( Extrait sans vergogne de Wikipedia )

Vous devrez trouver une structure de distribution et d'erreur pour les , probablement distribués normalement, avec une structure de variance-co-variance. Vous pouvez ensuite configurer une distribution précédente pour , et et exécuter une régression linéaire bayésienne comme cela a été mentionné ci-dessus. α i β i γ seitαiβiγs

Examen des effets d'annonce

À la date de l'annonce, il est raisonnable de penser qu'il pourrait y avoir des retours anormaux ( ). De nouvelles informations viennent d'être publiées sur le marché, de sorte que les réactions ne constituent généralement pas une violation de tout type d'arbitrage ou de théorèmes d'efficacité. Ni vous ni moi ne savons quels seront les effets d'annonce. Il n'y a pas toujours beaucoup de conseils théoriques non plus. Ainsi, tester peut nécessiter des connaissances beaucoup plus spécifiques que celles dont nous disposons (voir ci-dessous).γ 0 = 0γ00γ0=0

Mais une partie de l'attrait de l'analyse bayésienne est que vous pouvez examiner toute la distribution postérieure de . Cela vous permet de répondre à certains égards à des questions plus intéressantes telles que "Quelle est la probabilité que les rendements excédentaires annoncés soient négatifs?" Donc, pour les retours anormaux à la date d'annonce, je suggère d'abandonner les tests d'hypothèse stricts. Ils ne vous intéressent pas de toute façon - avec la plupart des études d'événements, vous voulez vraiment savoir quelle peut être la réaction des prix à une annonce, pas ce qu'elle n'est pas!γ0

Dans cet esprit, un résumé intéressant de vos postérieurs pourrait être la probabilité que . Une autre pourrait être la probabilité que soit supérieur à une variété de valeurs de seuil, ou les quantiles de la distribution postérieure pour . Enfin, vous pouvez toujours tracer la partie postérieure de avec sa moyenne, sa médiane et son mode. Mais là encore, les tests d'hypothèse stricts peuvent ne pas être ce que vous voulez.γ 0 γ 0 γ 0γ00γ0γ0γ0

Cependant, pour les dates avant et après l'annonce, les tests d'hypothèses strictes peuvent jouer un rôle important, car ces retours peuvent être considérés comme des tests d'efficacité de forme forte et semi-forte

Test des violations de l'efficacité des formes semi-fortes

L'effcacité de forme semi-forte et une absence de coûts de transaction impliquent que les cours des actions ne devraient pas continuer à s'ajuster après l'annonce de l'événement. Cela correspond à une intersection d'hypothèses précises que .γs>0=0

Les bayésiens sont mal à l'aise avec les tests de cette forme, , appelés tests "pointus". Pourquoi? Sortons ceci du contexte de la finance pendant une seconde. Si je vous demandais de former un a priori sur le revenu moyen des citoyens américains, vous me donneriez probablement une distribution continue, sur les revenus possibles, atteignant peut-être un pic d'environ 60 000 $ . Si vous preniez ensuite un échantillon des revenus américains et tentiez de tester l'hypothèse que la moyenne de la population était exactement vous utiliseriez un facteur Bayes:γs=0x¯fX={xi}i=1n $60,000

P(x¯=$60,000|X)=x¯=$60,000P(X)f(x¯)x¯$60,000P(X)f(x¯)

L'intégrale sur le dessus est nulle, car la probabilité qu'un seul point de la distribution a priori continue soit nulle. L'intégrale en bas serait 1, donc . Cela se produit à cause de l'a priori continu , et non à cause de quelque chose d'essentiel à la nature de l'inférence bayésienne.P(x¯=$60,000|X)=0

À bien des égards, les tests qui sont des tests de prix des actifs. La tarification des actifs est bizarre pour les Bayésiens. Pourquoi est-ce bizarre? Parce que, contrairement à mes revenus antérieurs, l'application stricte de certaines hypothèses d'efficacité prédit une interception d'exactement 0 après l'événement. Tout positif ou négatif est une violation de l'efficacité de forme semi-forte, et potentiellement une énorme opportunité de profit. Ainsi, un a priori valide pourrait mettre une probabilité positive sur . C'est exactement l'approche adoptée dans Harvey et Zhou (1990) . Plus généralement, imaginez que vous avez un a priori en deux parties. Avec la probabilité vous croyez en l'efficacité des formes fortes (γs>0=0γs>0γs>0=0pγs0=0) et avec une probabilité vous ne croyez pas à l'efficacité des formes fortes. À condition de savoir que l'efficacité des formes fortes est fausse, vous pensez qu'il existe une distribution continue sur , . Ensuite, vous pouvez construire le test du facteur Bayes:1pγs>0f

P(γs>0=0|data)=P(data|γs>0=0)pγs>00P(data|γs>0)(1p)f(γs>0)>0

Ce test fonctionne car à condition que la forme forte soit vraie, vous savez que . γs>0=0Dans ce cas, votre a priori est maintenant un mélange de distributions continues et discrètes.

Qu'un test pointu existe ne vous empêche pas d'utiliser des tests plus subtils. Il n'y a aucune raison pour que vous ne puissiez pas examiner la distribution de la même manière que je l'ai suggéré pour . Cela peut être plus intéressant, d'autant plus que cela ne dépend pas d'une croyance selon laquelle les coûts de transaction sont inexistants. Des intervalles crédibles peuvent être formés, et en fonction de vos croyances sur les coûts de transaction, vous pouvez construire des tests de modèle basés sur des intervalles . À la suite de Brav (2000), vous pouvez également établir des densités prédictives basées sur le modèle de retour «normal» ( ) pour comparer avec les rendements réels, en tant que pont entre les méthodes bayésienne et fréquentiste. γ s = 0 γ s > 0 γ s = 0γs>0γs=0γs>0γs=0

Rendements anormaux cumulés

Jusqu'à présent, tout a été une discussion sur les rendements anormaux. Je vais donc entrer rapidement en RCA:

CARτ=t=0τγt

Il s'agit d'une contrepartie proche des rendements anormaux cumulés moyens en fonction des résidus auxquels vous êtes habitué. Vous pouvez trouver la distribution postérieure en utilisant une intégration numérique ou analytique, en fonction de vos antérieurs. Parce qu'il n'y a aucune raison de supposer , il n'y a aucune raison de supposer , donc je préconiserais la même analyse qu'avec les effets d'annonce, sans test d'hypothèse précis.CAR t > 0 = 0γ0=0CARt>0=0

Comment implémenter dans Matlab

Pour une version simple de ces modèles, vous avez juste besoin d'une ancienne régression linéaire bayésienne régulière. Je n'utilise pas Matlab mais il semble qu'il y ait une version ici . Il est probable que cela ne fonctionne qu'avec des prieurs conjugués.

Pour les versions plus compliquées, par exemple le test d'hypothèse forte, vous aurez probablement besoin d'un échantillonneur Gibbs. Je ne connais aucune solution prête à l'emploi pour Matlab. Vous pouvez vérifier les interfaces avec JAGS ou BUGS.

jayk
la source
Merci pour cette réponse complète et très utile! A propos de votre premier point: Est - ce le cas même si je suis seulement intéressé par l'effet d'une législation spécifique sur une entreprise spécifique ( à savoir l' effet de l' événement seulement pour un petit nombre entreprisesn1 )? Si dans ce cas il est toujours nécessaire d'augmenter la taille de l'échantillon, combien d'entreprises seraient nécessaires et comment les sélectionner?
Constantin
L'effet d'une législation spécifique peut être impossible à trouver. S'il s'agit d'une loi appliquée (par exemple) à une industrie spécifique, il sera difficile de séparer les tendances de l'industrie de la législation. Je proposerais certainement plus de 30 entreprises si possible. Vous pouvez toujours vérifier si vos antérieurs et postérieurs sont très différents. Si votre postérieur n'a pas beaucoup changé par rapport à votre précédent, il est probable que la taille de votre échantillon soit trop petite.
jayk
Vous arrive-t-il de pouvoir me donner une référence pour une étude d'événement qui utilise des variables muettes pour les dates pré / post-événement? Jusqu'à présent, je n'ai pas trouvé cette méthodologie dans la littérature. Je l'apprécierais beaucoup!
Constantin
Je n'en ai pas vu, mais je pense que la méthode a du sens dans le contexte (avec les mises en garde que j'ai mises dessus). Une alternative serait d'estimer vos paramètres sur les dates de pré-annonce, puis d'utiliser le postérieur pour générer les retours à l'avenir comme dans l'article Brav que j'ai mentionné ci-dessus.
jayk