Les modèles de pièces biaisées ont généralement un paramètre . Une façon d'estimer la partir d'une série de tirages est d'utiliser une distribution bêta a priori et de calculer la distribution postérieure avec vraisemblance binomiale.θ
Dans mes paramètres, en raison d'un processus physique étrange, les propriétés de ma pièce changent lentement et devient une fonction du temps . Mes données sont un ensemble de tirages ordonnés, c'est-à-dire . Je peux considérer que je n'ai qu'un seul tirage pour chaque sur une grille temporelle discrète et régulière.t { H , T , H , H , H , T , . . . } t
Comment modéliseriez-vous cela? Je pense à quelque chose comme un filtre de Kalman adapté au fait que la variable cachée est et garde la vraisemblance binomiale. Que puis-je utiliser pour modéliser pour garder l'inférence traitable?P ( θ ( t + 1 ) | θ ( t ) )
Modifiez les réponses suivantes (merci!) : Je voudrais modéliser comme une chaîne de Markov d'ordre 1 comme cela se fait dans les filtres HMM ou Kalman. La seule hypothèse que je peux faire est que est lisse. Je pourrais écrire avec un petit bruit gaussien (idée de filtre de Kalman), mais cela briserait l'exigence que doit rester dans . Suivant l'idée de @J Dav, je pourrais utiliser une fonction probit pour mapper la ligne réelle à , mais j'ai l'intuition que cela donnerait une solution non analytique. Une distribution bêta avec une moyenneθ ( t ) P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ ϵ θ [ 0 , 1 ] [ 0 , 1 ] θ ( t ) et une variance plus large pourrait faire l'affaire.
Je pose cette question car j'ai le sentiment que ce problème est si simple qu'il doit avoir été étudié auparavant.
la source
Réponses:
Je doute que vous puissiez trouver un modèle avec une solution analytique, mais l'inférence peut toujours être rendue exploitable en utilisant les bons outils car la structure de dépendance de votre modèle est simple. En tant que chercheur en apprentissage automatique, je préférerais utiliser le modèle suivant car l'inférence peut être rendue assez efficace en utilisant la technique de propagation des attentes:
Soit le résultat du ème essai. Définissons le paramètre variant dans le tempstX(t) t
Pour lier avec , introduisez des variables latentesη(t) X(t)
et le modèle doit êtreX(t)
Y (X(t)=1 si , et sinon. Vous pouvez en fait ignorer les et les marginaliser pour simplement dire , (avec cdf de standard normal) mais l'introduction de variables latentes facilite l'inférence. Notez également que dans votre paramétrage initial .Y(t)≥0 X(t)=0 Y(t) P[X(t)=1]=Φ(η(t)/β) Φ θ(t)=η(t)/β
Si vous souhaitez implémenter l'algorithme d'inférence, jetez un œil à cet article . Ils utilisent un modèle très similaire afin que vous puissiez facilement adapter l'algorithme. Pour comprendre EP, la page suivante peut être utile. Si vous souhaitez poursuivre cette approche, faites-le moi savoir; Je peux fournir des conseils plus détaillés sur la façon de mettre en œuvre l'algorithme d'inférence.
la source
Pour élaborer mon commentaire, un modèle tel que p (t) = p exp (-t) est un modèle qui est simple et permet d'estimer p (t) en estimant p utilisant une estimation du maximum de vraisemblance. Mais la probabilité diminue-t-elle vraiment de façon exponentielle. Ce modèle serait clairement erroné si vous observez des périodes de temps avec une fréquence de réussite élevée que vous avez observée à des moments antérieurs et ultérieurs. Le comportement oscillatoire pourrait être modélisé comme p (t) = p | sint |. Les deux modèles sont très maniables et peuvent être résolus par un maximum de vraisemblance mais ils donnent des solutions très différentes.0 0 0
la source
Votre probabilité change avec mais comme Michael l'a dit, vous ne savez pas comment. linéairement ou non? Cela ressemble à un problème de sélection de modèle où votre probabilité :t p
Une approche exploratoire simple serait d'essayer plusieurs probits pour avec différents non linéaires et d'effectuer une sélection de modèle basée sur des critères d'information standard.Φ g() g()
Pour répondre à votre question rééditée :
Comme vous l'avez dit, l'utilisation de probit impliquerait uniquement des solutions numériques, mais vous pouvez utiliser une fonction logistique à la place:
Fonction logistique:P[θ(t+1)]=11+exp(θ(t)+ϵ)
Linéarisé par:logP1−P=θ(t)+ϵ
Je ne sais pas comment cela peut fonctionner sous l'approche du filtre de Kalman, mais je crois toujours qu'une spécification non linéaire comme ou bien d'autres sans terme aléatoire fait le travail. Comme vous pouvez le voir, cette fonction est "douce" dans le sens où elle est continue et différenciable. Malheureusement, l'ajout de générerait des sauts de la probabilité résultante, ce que vous ne voulez pas, donc mon conseil serait de supprimer .ϵ ϵθ(t+1)=at3+bt2+ct+d ϵ ϵ
Probabilité de logit:P[Coint+1=H|t]=11+exp(θ(t))
Vous avez déjà randomnes dans l'événement bernoulli (chaîne de Markov) et vous en ajoutez une source supplémentaire en raison de . Ainsi, votre problème pourrait être résolu comme un Probit ou un Logit estimé par Maximum de vraisemblance avec comme variable explicative. Je suppose que vous convenez que cette parcimonie est très importante. Sauf si votre objectif principal est d'appliquer une méthode donnée (HMM et Kalman Filter) et de ne pas donner la solution valide la plus simple à votre problème.tϵ t
la source