Processus AR (1) avec des erreurs de mesure hétéroscédastiques

13

1. Le problème

J'ai des mesures d'une variable yt , où t=1,2,..,n , pour lequel j'ai une distribution obtenue via MCMC, qui pour simplifier je suppose que c'est un gaussien de moyenne et de variance .fyt(yt)μtσt2

J'ai un modèle physique pour ces observations, disons , mais les résidus semblent être corrélés; en particulier, j'ai des raisons physiques de penser qu'un processus suffira pour prendre en compte la corrélation, et je prévois d'obtenir les coefficients de l'ajustement via MCMC, pour lesquels j'ai besoin de la probabilité . Je pense que la solution est plutôt simple, mais je ne suis pas sûr (cela semble si simple, que je pense que je manque quelque chose).g(t)rt=μtg(t)AR(1)

2. Dériver la probabilité

Un processus moyenne nulle peut s'écrire: où je supposerai . Les paramètres à estimer sont donc (dans mon cas, je dois également ajouter les paramètres du modèle g (t) , mais ce n'est pas le problème). Ce que j'observe cependant, c'est la variable R_t = X_t + \ eta_t, \ \ \ (2) où je suppose que \ eta_t \ sim N (0, \ sigma_t ^ 2) , et le \ sigma_t ^ 2 sont connus (le erreurs de mesure). Parce que X_t est un processus gaussien, R_t l' est aussi. En particulier, je sais que AR(1)

Xt=ϕXt1+εt,   (1)
εtN(0,σw2)θ={ϕ,σw2}g(t)
Rt=Xt+ηt,   (2)
ηtN(0,σt2)σt2XtRt
X1N(0,σw2/[1ϕ2]),
donc
R1N(0,σw2/[1ϕ2]+σt2).
Le prochain défi consiste à obtenir Rt|Rt1 pour t1 . Pour dériver la distribution de cette variable aléatoire, notez que, en utilisant l'éq. (2) Je peux écrire
Xt1=Rt1ηt1.   (3)
En utilisant l'équation. (2) , et en utilisant la définition de l'équation. (1) , je peux écrire,
Rt=Xt+ηt=ϕXt1+εt+ηt.
En utilisant l'eq. (3) dans cette dernière expression, alors j'obtiens , R_ {t} = \ phi (R_ {t-1} - \ eta_ {t-1}) + \ varepsilon_ {t} + \ eta_t,
Rt=ϕ(Rt1ηt1)+εt+ηt,
ainsi,
Rt|Rt1=ϕ(rt1ηt1)+εt+ηt,
et, par conséquent,
Rt|Rt1N(ϕrt1,σw2+σt2ϕ2σt12).
Enfin, je peux écrire la fonction de vraisemblance comme
L(θ)=fR1(R1=r1)t=2nfRt|Rt1(Rt=rt|Rt1=rt1),
où les f() sont les distributions des variables que je viens de définir, .ie, définissant σ2=σw2/[1ϕ2]+σt2,
fR1(R1=r1)=12πσ2exp(r122σ2),
et définissant σ2(t)=σw2+σt2ϕ2σt12 ,
fRt|Rt1(Rt=rt|Rt1=rt1)=12πσ2(t)exp((rtϕrt1)22σ2(t))

3. Questions

  1. Ma dérivation est-elle correcte? Je n'ai pas d'autres ressources à comparer que des simulations (qui semblent d'accord), et je ne suis pas statisticien!
  2. Y a-t-il une dérivation de ce genre de choses dans la littérature pour les ou ? MA(1)ARMA(1,1)Une étude pour les en général qui pourraient être particuliers à ce cas serait bien.ARMA(p,q)
Néstor
la source
Je n'ai pas exactement de solution pour vous. Mais, je pense que c'est une sorte de problème de variables d'erreur. J'ai vu ce genre de choses dans la théorie macroéconomique de Thomas Sergent (livre des années 80). Vous voudrez peut-être regarder celui-là.
Métriques
Merci pour votre contribution, @Metrics. Je vais consulter le livre!
Néstor

Réponses:

1
  1. Vous êtes sur la bonne voie, mais vous avez fait une erreur en dérivant la distribution de étant donné : la moyenne conditionnelle n'est pas . Il s'agit de , où est votre meilleure estimation de rapport à la période précédente. La valeur de inclut les informations des observations précédentes ainsi que . (Pour voir ceci, considérez une situation où et sont négligeables, donc vous estimez effectivement une moyenne fixe. Après beaucoup d'observations, votre incertitude sur sera beaucoup plus petite queRtRt1ϕrt1ϕx^t1x^t1Xx^t1rt1σwϕXση .) Cela peut être déroutant au premier abord, parce que vous observez et non . Cela signifie simplement que vous avez affaire à un modèle d'espace d'état .RX

  2. Oui, il existe un cadre très général pour l'utilisation de modèles linéaires-gaussiens avec des observations bruyantes, appelé filtre de Kalman . Cela s'applique à tout ce qui a une structure ARIMA et bien d'autres modèles également. Variable dans le temps est OK pour le filtre de Kalman, à condition qu'il ne soit pas stochastique. Les modèles avec, par exemple, une volatilité stochastique nécessitent des méthodes plus générales. Pour voir comment le filtre de Kalman est dérivé, essayez Durbin-Koopman ou le chapitre 3 de Harvey . Dans la notation de Harvey, votre modèle a , , , , et .σηZ=1d=c=0Ht=ση,t2T=ϕR=1Q=σw2

Jamie Hall
la source
Salut Jamie, merci pour votre contribution. Quelques commentaires: 1. Je n'en suis pas sûr. C'était, en fait, ma première tentative de solution, mais mon intuition et mes simulations ne sont pas d'accord avec cela. Le fait est que je n’observe pas , j’observe ; plus, pouvez-vous prouver (arithmétiquement) que la moyenne conditionnelle de la variable aléatoire (notez que ce n'est pas ) est en fait ? 2. Pouvez-vous élaborer sur l'application du filtre de Kalman à ce problème particulier? XtRtRt|Rt1=rt1Rt|Xt1=xt1ϕx^t1
Néstor
Bonjour Nestor, j'ai modifié la réponse pour répondre à vos commentaires. J'espère que cela pourra aider.
Jamie Hall
Salut Jamie: sur le deuxième point, ça va, merci :-)! Cependant, je ne vois toujours pas votre premier point. Pouvez-vous m'indiquer une dérivation formelle? En particulier, je voudrais savoir quelle partie de mon raisonnement est erronée (et pourquoi)!
Néstor
Vous avez sauté une étape: la distribution de avec . C'est , où est la variance que vous avez calculée à la première étape, et est le double de la moyenne harmonique de et . (C'est comme la mise à jour bayésienne avec deux fichiers PDF gaussiens.) Votre équation (3) est formellement correcte, mais vous jetez des informations en les utilisant à la place de . X1R1N(σx,12(σx,12+ση,12)r1,σx,22)σx,12σx,22σx,12ση,12p(Xt1|R1:t1)
Jamie Hall du
-1

Honnêtement, vous devez coder cela dans des BUG ou STAN et ne pas vous en soucier à partir de là. Sauf s'il s'agit d'une question théorique.

DavidShor
la source
2
(-1) À cette réponse; c'est clairement une question théorique ;-). Envisagez d'améliorer pourquoi vous pensez que je devrais le coder dans des BUG ou STAN et ce que cela a à voir avec la question d'origine?
Néstor