Différence entre les modèles de Markov cachés et le filtre à particules (et le filtre de Kalman)

21

Voici ma vieille question

Je voudrais demander si quelqu'un connaît la différence (s'il y a une différence) entre les modèles de Markov cachés (HMM) et le filtre à particules (PF), et par conséquent le filtre de Kalman, ou dans quelles circonstances nous utilisons quel algorithme. Je suis étudiant et je dois faire un projet, mais d'abord je dois comprendre certaines choses.

Ainsi, selon la bibliographie, les deux sont des modèles d'espace d'état , y compris des états cachés (ou latents ou non observés). Selon Wikipedia (Hidden_Markov_model) "dans HMM, l'espace d'état des variables cachées est discret, tandis que les observations elles-mêmes peuvent être discrètes (généralement générées à partir d'une distribution catégorique) ou continues (généralement à partir d'une distribution gaussienne). Les modèles de Markov cachés peuvent également être généralisés pour permettre des espaces d'états continus. Des exemples de tels modèles sont ceux où le processus de Markov sur des variables cachées est un système dynamique linéaire, avec une relation linéaire entre les variables liées et où toutes les variables cachées et observées suivent une distribution gaussienne. Dans des cas simples, comme le système dynamique linéaire qui vient d'être mentionné, l'inférence exacte est traitable (dans ce cas, en utilisant le filtre de Kalman); cependant, en général, l'inférence exacte dans les HMM avec des variables latentes continues est irréalisable, et des méthodes approximatives doivent être utilisées,"

Mais pour moi, c'est un peu déroutant… En termes simples, cela signifie-t-il la suite (basée également sur plus de recherches que j'ai faites):

  • Dans HMM, l'espace d'état peut être discret ou continu . Les observations elles-mêmes peuvent également être discrètes ou continues . HMM est également un système dynamique linéaire et gaussien ou non gaussien.
  • Dans PF, l'espace d'état peut être discret ou continu . Les observations elles-mêmes peuvent également être discrètes ou continues . Mais PF est un système dynamique non linéaire (et non gaussien?) (Est-ce leur différence?).
  • Le filtre de Kalman (ressemble aussi à moi comme HMM) est utilisé lorsque nous avons un système dynamique linéaire et gaussien .

Aussi comment puis-je savoir quel algorithme choisir, parce que pour moi tous ceux-ci semblent les mêmes ... J'ai aussi trouvé un article (pas en anglais) qui dit que PF bien que puisse avoir des données linéaires (par exemple des données brutes d'un capteur-kinect qui reconnaît un mouvement), le système dynamique peut être non linéaire. Cela peut-il arriver? Est-ce correct? Comment?

Pour la reconnaissance des gestes, les chercheurs peuvent utiliser HMM ou PF, mais ils n'expliquent pas pourquoi ils sélectionnent chaque algorithme… Est-ce que quelqu'un sait comment je peux être aidé à distinguer ces algorithmes, à comprendre leurs différences et comment choisir le meilleur algorithme?

Je suis désolé si ma question est trop grande ou si certaines parties sont naïves mais je n'ai pas trouvé quelque part une réponse convaincante et scientifique. Merci beaucoup d'avance pour votre temps!

Voici ma NOUVELLE question (selon l'aide de @ conjugateprior)

Donc, avec une lecture plus approfondie, je voudrais mettre à jour certaines de mes parties de mon commentaire précédent et m'assurer que j'ai mieux compris ce qui se passe.

  • Toujours en termes simples, le parapluie est constitué par les réseaux bayésiens dynamiques dans lesquels les modèles de HMM et de l'espace d'état sont inclus (sous-classes) ( http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf ).
  • De plus, la différence initiale entre les 2 modèles est que, dans HMM, les variables d'état cachées sont discrètes , tandis que les observations peuvent être discrètes ou continues . Dans PF, les variables d'état caché sont continues (vecteur d'état caché à valeur réelle), et les observations ont des distributions gaussiennes .
  • Toujours selon @conjugateprior, chaque modèle a les 3 tâches suivantes: filtrage, lissage et prédiction. En filtrage, le modèle HMM utilise pour les variables d'état cachées discrètes la méthode Algorithme Forward, l'espace d'état utilise pour les variables continues et le système dynamique linéaire le filtre de Kalman, etc.
  • Cependant, HMM peut également être généralisé pour autoriser des espaces d'état continus .
  • Avec ces extensions de HMM, les 2 modèles semblent être conceptuellement identiques (comme cela est également mentionné dans Hidden Markov Model vs Markov Transition Model vs State-Space Model ...? ).

Je pense que j'utilise une terminologie un peu plus précise, mais tout est encore flou pour moi. Quelqu'un peut-il m'expliquer quelle est la différence entre le modèle HMM et le modèle State Space ?

Parce que je ne trouve vraiment pas de réponse adaptée à mes besoins.

Merci encore une fois!

user5584748
la source
1
Si la bibliothèque de votre école a ce livre: crcpress.com/Time-Series-Modeling-Computation-and-Inference/… je le consulterais. Il explique bien les trois sujets qui, je pourrais le mentionner, sont trois sujets très distincts.
Je viens de vérifier que la bibliothèque n'a pas ce livre, malheureusement .. donc si vous pouviez m'envoyer les parties qui, selon vous, répondent à ma question ou m'aider à distinguer également ces sujets, ce serait génial! :)
user5584748

Réponses:

15

Il sera utile de distinguer le modèle de l'inférence que vous souhaitez faire avec, car maintenant la terminologie standard mélange les deux.

Le modèle est la partie où vous spécifiez la nature de: l'espace caché (discret ou continu), la dynamique de l'état caché (linéaire ou non linéaire), la nature des observations (généralement conditionnellement multinomiales ou normales), et le modèle de mesure se connectant l'état caché aux observations. Les HMM et les modèles d'espace d'état sont deux de ces ensembles de spécifications de modèle.

tt

Dans les situations où l'état est continu, la dynamique de l'état et la mesure linéaire et tout le bruit est normal, un filtre de Kalman fera ce travail efficacement. Son analogue lorsque l'état est discret est l'algorithme direct. Dans le cas où il y a non-normalité et / ou non-linéarité, on retombe sur des filtres approximatifs. Il existe des approximations déterministes, par exemple des filtres de Kalman étendus ou non parfumés, et il existe des approximations stochastiques, la plus connue étant le filtre à particules.

Le sentiment général semble être qu'en présence de non-linéarité inévitable dans l'état ou les parties de mesure ou de non-normalité dans les observations (les situations problématiques courantes), on essaie de s'en tirer avec l'approximation la moins chère possible. Donc, EKF puis UKF puis PF.

La littérature sur le filtre de Kalman non parfumé comporte généralement des comparaisons de situations où il pourrait fonctionner mieux que la linéarisation traditionnelle du filtre de Kalman étendu.

Le filtre à particules a une généralité presque complète - toute non-linéarité, toutes les distributions - mais il a, selon mon expérience, exigé un réglage assez soigneux et est généralement beaucoup plus lourd que les autres. Dans de nombreuses situations cependant, c'est la seule option.

En ce qui concerne la lecture: j'aime le ch.4-7 du filtrage et du lissage bayésien de Särkkä, bien qu'il soit assez concis. L'auteur met à disposition une copie en ligne pour un usage personnel. Sinon, la plupart des livres sur les séries temporelles de l'espace étatique couvriront ce matériau. Pour le filtrage des particules, il existe un Doucet et al. volume sur le sujet, mais je suppose que c'est assez vieux maintenant. Peut-être que d'autres indiqueront une référence plus récente.

conjugateprior
la source
Tout d'abord merci beaucoup pour votre réponse. Veuillez vérifier que j'ai modifié la question ci-dessus afin d'être plus cohérent et précis avec la terminologie. Je reformule également toute ma question.
user5584748
Dans votre réécriture, il n'est pas tout à fait vrai que "Dans PF, les variables d'état caché sont continues (vecteur d'état caché à valeur réelle), et les observations ont des distributions gaussiennes." PF est un filtre. Le modèle pour lequel il s'agit d'un filtre doit avoir un espace d'états continu (avec une structure markovienne ou autre) mais est par ailleurs sans contrainte: toutes les distributions, toutes les dynamiques et tout processus de mesure.
conjugateprior
Vous pouvez, par exemple, utiliser un PF pour filtrer un modèle d'espace d'état gaussien linéaire ordinaire. Cela fonctionnerait très bien. Vous n'avez tout simplement pas à le faire car le filtre de Kalman est exact.
conjugateprior
4
"Quelle est la différence entre le modèle HMM et le modèle State Space?" Fondamentalement: par convention, les HMM ont un état discret. Par convention également, les «modèles d'espace d'états» désignent des choses avec un état continu.
conjugateprior
Merci beaucoup! Cette différence se produit donc par convention (et selon la bibliographie). Mais en général, nous pouvons choisir le modèle que nous voulons. Est-ce exact? Le modèle que je choisirai dépendra si j'aurai de meilleurs résultats?
user5584748