Comment vérifier quel modèle est le meilleur dans l'analyse des séries temporelles de l'espace d'état?

15

Je fais l'analyse de données de séries chronologiques par des méthodes d'espace d'état. Avec mes données, le modèle stochastique au niveau local a totalement surpassé le modèle déterministe. Mais le modèle de niveau et de pente déterministe donne de meilleurs résultats qu'avec le niveau stochastique et la pente stochastique / déterministe. Est-ce quelque chose d'habitude? Toutes les méthodes de R nécessitent des valeurs initiales, et j'ai lu quelque part que l'ajustement d'un modèle ARIMA en premier et la prise de valeurs à partir de là comme valeurs initiales pour l'analyse de l'espace d'états est un moyen; possible? ou toute autre proposition? Je dois avouer ici que je suis totalement nouveau dans l'analyse de l'espace d'états.

Scortchi - Réintégrer Monica
la source
3
Veuillez fournir l'exemple. Maintenant, on ne sait pas quel est votre problème réel.
mpiktas
Vous voulez dire un modèle d'espace d'états de lissage exponentiel? Quels packages R utilisez-vous?
Zach
essayez-vous de comparer des modèles ou souhaitez-vous sélectionner un modèle?
naught101
Premièrement, comme déjà mentionné, il n'est pas clair quel est votre problème réel. Vous écrivez que A surperformé B et B donne de meilleurs résultats que A. C'est déroutant. Deuxièmement, le package R «prévisionnel» a des méthodes de séries chronologiques automatiques. Ils incluent: auto.arima (), ets (), tbats () et bats ().
puissance
Pouvez-vous expliquer ce que vous voulez dire lorsque vous dites «surperformé» et «donne de meilleurs résultats que»?
Glen_b -Reinstate Monica

Réponses:

2

Pour répondre à votre première question. Oui, tout est possible. Ce n'est ni habituel ni inhabituel. Vous devez laisser les données vous dire quel est le bon modèle. Essayez d'augmenter le modèle avec des saisonniers, des cycles et des régresseurs explicatifs si possible.

Vous devez non seulement comparer le critère d'information Akaike (AIC) pour comparer les modèles, mais également vérifier que les résidus (terme irrégulier) sont normaux, homoscédastiques et indépendants (test de Ljung-Box). Si vous pouvez trouver un modèle qui possède toutes ces propriétés souhaitables. Cela devrait être votre modèle préféré (il est probable qu'un modèle avec toutes ces propriétés aura le meilleur AIC).

Bien que les valeurs initiales affectent quel point maximum de la fonction log-vraisemblance est trouvée, si votre modèle est bien spécifié, il ne devrait pas trop varier et il devrait y avoir un candidat évident pour le meilleur modèle avec les meilleures valeurs initiales. Je fais beaucoup de ce type d'analyse dans Matlab et j'ai trouvé que la meilleure façon de trouver les valeurs initiales est de jouer un peu. Cela peut être fastidieux mais ça marche bien au final.

JoeDanger
la source