Compte tenu de toutes les bonnes propriétés des modèles d'état et de la KF, je me demande quels sont les inconvénients de la modélisation de l'espace et de l'utilisation du filtre de Kalman (ou EKF, UKF ou filtre de particules) pour l'estimation. Supposons des méthodologies conventionnelles comme ARIMA, VAR ou des méthodes ad-hoc / heuristiques.
Sont-ils difficiles à calibrer? Sont-ils compliqués et difficiles à comprendre comment un changement dans la structure d'un modèle affectera les prévisions?
Autrement dit, quels sont les avantages d'ARIMA, VAR conventionnel par rapport aux modèles d'espace d'états?
Je ne peux penser qu'aux avantages d'un modèle d'espace d'états:
- Il gère facilement les ruptures structurelles, les décalages, les paramètres variant dans le temps de certains modèles statiques - il suffit de rendre ces paramètres dynamiques les états d'un modèle d'état-espace et le modèle s'adaptera automatiquement à tout décalage de paramètres;
- Il traite les données manquantes de manière très naturelle, n’effectuez que l’étape de transition de KF et ne mettez pas à jour l’étape de mise à jour;
- Il permet de modifier à la volée les paramètres d'un modèle d'état lui-même (covariances de bruits et matrices de transition / d'observation). Ainsi, si votre observation actuelle provient d'une source légèrement différente de celle des autres, vous pouvez facilement l'intégrer à l'estimation sans le faire. Rien de spécial;
- L'utilisation des propriétés ci-dessus permet de traiter facilement des données à espacement irrégulier: soit modifier un modèle à chaque fois en fonction de l'intervalle entre les observations, soit utiliser un intervalle régulier et traiter les intervalles sans observations comme des données manquantes;
- Il permet d’utiliser simultanément des données de différentes sources dans le même modèle pour estimer une quantité sous-jacente;
- Il permet de construire un modèle à partir de plusieurs composants dynamiques non observables interprétables et de les estimer.
- Tout modèle ARIMA peut être représenté sous une forme d'espace d'état, mais seuls les modèles d'espace d'état simples peuvent être représentés exactement sous une forme ARIMA.
time-series
arima
kalman-filter
var
Kochede
la source
la source
Réponses:
Voici une liste préliminaire des inconvénients que j'ai pu extraire de vos commentaires. Les critiques et les ajouts sont les bienvenus!
Globalement - comparés à ARIMA, les modèles d’espace à états vous permettent de modéliser des processus plus complexes, d’avoir une structure interprétable et de gérer facilement les irrégularités des données; mais pour cela, vous payez avec la complexité accrue d'un modèle, un calibrage plus strict, moins de connaissances de la communauté.
la source
Merci @IrishStat pour plusieurs très bonnes questions dans les commentaires, la réponse à vos questions est trop longue pour être postée en tant que commentaire, je la poste donc en tant que réponse (malheureusement, pas à la question initiale du sujet).
Les questions étaient les suivantes: " Identifie-t-il clairement les changements de tendance dans le temps et signale-t-il les moments où la tendance change? Fait-il la distinction entre les changements de paramètres et les changements de variance d'erreur et en rend compte? Les détecte-t-il et rapporte-t-il les effets de retard et de retard spécifiques autour de l'utilisateur? Peut-on spécifier le nombre minimum de valeurs dans un groupe avant qu’un changement de niveau / une tendance de temps local ne soit déclaré? T-il distinguer entre le besoin de transformations de puissance et les points déterministes dans le temps où la variance d'erreur change? "
la source
Le filtre de Kalman est l’estimateur quadratique linéaire optimal lorsque la dynamique de l’état et les erreurs de mesure suivent les hypothèses dites gaussiennes linéaires ( http://wp.me/p491t5-PS ). Ainsi, tant que vous connaissez votre dynamique et vos modèles de mesure et qu’ils suivent les hypothèses linéaires de Gauss, il n’existe pas de meilleur estimateur dans la classe des estimateurs linéaires quadratiques. Cependant, les raisonneurs les plus courants pour les applications Kalman Filter "en échec" sont:
Connaissance imprécise / incorrecte de la dynamique d'état et des modèles de mesure.
Initialisation inexacte du filtre (fournissant une estimation d'état initiale et une covariance incohérentes avec l'état réel du système). Ceci est facilement surmonté en utilisant une procédure d'initialisation des moindres carrés pondérés (WLS).
Incorporer des mesures qui sont des "valeurs aberrantes" statistiques par rapport au modèle de dynamique de système. Cela peut entraîner des éléments négatifs sur le gain de Kalman, ce qui peut conduire à une matrice de covariance semi-définitive non positive après la mise à jour. Cela peut être évité en utilisant des algorithmes de "déclenchement", tels que le déclenchement ellipsoïdal, pour valider la mesure avant de mettre à jour le filtre de Kalman avec cette mesure.
Voici quelques-unes des erreurs / problèmes les plus courants rencontrés avec le filtre de Kalman. Sinon, si les hypothèses de vos modèles sont valides, le filtre de Kalman est un estimateur optimal.
la source
Vous pouvez vous référer à l'excellent livre Bayesian Forecasting and Dynamic Models (Harrison et West, 1997). Les auteurs montrent que presque tous les modèles de séries chronologiques classiques sont des cas particuliers du modèle dynamique général. Ils soulignent également les avantages. L'un des principaux avantages est peut-être la facilité avec laquelle vous pouvez intégrer de nombreux modèles d'espace d'états en augmentant simplement le vecteur d'état. Vous pouvez, par exemple, intégrer de manière transparente des régresseurs, des facteurs saisonniers et un composant autorégressif dans un seul modèle.
la source
J'ajouterais que si vous utilisez directement une fonction d'espace d'état, vous devrez probablement comprendre les différentes matrices composant un modèle, ainsi que leur interaction et leur fonctionnement. Cela ressemble beaucoup plus à la définition d'un programme qu'à la définition d'un modèle ARIMA. Si vous travaillez avec un modèle d'espace d'état dynamique, cela devient encore plus compliqué.
Si vous utilisez un progiciel qui a une fonction d'espace d'état vraiment, vraiment agréable, vous pourrez peut-être éviter cela, mais la grande majorité de ces fonctions dans les packages R vous oblige à entrer dans les détails à un moment donné.
À mon avis, cela ressemble beaucoup aux statistiques bayésiennes en général, dont le mécanisme nécessite plus de compréhension, de soins et d’alimentation, que des fonctions plus fréquentistes.
Dans les deux cas, les détails / connaissances supplémentaires valent bien, mais cela pourrait constituer un obstacle à l’adoption.
la source