Je soupçonne qu'une série de séquences observées est une chaîne de Markov ...
X=⎛⎝⎜⎜⎜⎜AB⋮BCA⋮CDA⋮ADC⋮DBA⋮AAD⋮BCA⋮E⎞⎠⎟⎟⎟⎟
Mais comment vérifier qu'ils respectent bien la propriété sans mémoire de
P(Xi=xi|Xj=xj)?
Ou au moins prouver qu'ils sont de nature Markov? Notez que ce sont des séquences observées empiriquement. Des pensées?
ÉDITER
Juste pour ajouter, le but est de comparer un ensemble de séquences prévu à partir de celles observées. Nous aimerions donc recevoir des commentaires sur la meilleure façon de les comparer.
Matrice de transition du premier ordreMij=xij∑mxik
où m = A..E indique
M=⎛⎝⎜⎜⎜⎜⎜⎜0.18340.46970.18270.23780.24580.30770.11360.24040.18180.17880.07690.00760.22120.06290.11730.14790.25000.19230.33570.17880.28400.15910.16350.18180.2793⎞⎠⎟⎟⎟⎟⎟⎟
Valeurs propres de M
E=⎛⎝⎜⎜⎜⎜⎜⎜1.000000000−0.2283000000.1344000000.1136−0.0430i000000.1136+0.0430i⎞⎠⎟⎟⎟⎟⎟⎟
Vecteurs propres de M
V=⎛⎝⎜⎜⎜⎜⎜⎜0.44720.44720.44720.44720.4472−0.58520.7838−0.2006−0.00100.0540−0.4219−0.42110.37250.70890.0589−0.2343−0.0421i−0.4479−0.2723i0.63230.2123−0.0908i0.2546+0.3881i−0.2343+0.0421i−0.4479+0.2723i0.63230.2123+0.0908i0.2546−0.3881i⎞⎠⎟⎟⎟⎟⎟⎟
Réponses:
Je me demande si ce qui suit donnerait un test Pearson valide pour les proportions comme suit.χ2
Il est tentant pour moi de penser que chaque , de sorte que le total . Cependant, je ne suis pas tout à fait sûr de cela et apprécierais vos réflexions à ce sujet. Je ne suis pas non plus sûr de savoir si l'on doit être paranoïaque à propos de l'indépendance, et je voudrais diviser l'échantillon en deux pour estimer et . T ~ χ 2 12 p ˉ pTU∼χ23 T∼χ212 p^ p¯
la source
La propriété Markov peut être difficile à tester directement. Mais cela pourrait être suffisant pour ajuster un modèle qui suppose la propriété Markov et tester ensuite si le modèle est valide. Il peut s'avérer que le modèle ajusté est une bonne approximation qui vous est utile dans la pratique, et vous n'avez pas à vous soucier de savoir si la propriété Markov tient vraiment ou non.
Le parallèle peut être établi avec la régression linéaire. La pratique habituelle n'est pas de vérifier si la linéarité est vraie, mais si le modèle linéaire est une approximation utile.
la source
Pour concrétiser la suggestion de la réponse précédente, vous voulez d'abord estimer les probabilités de Markov - en supposant que c'est Markov. Voir la réponse ici Estimation des probabilités de la chaîne de Markov
Vous devriez obtenir un 4 x 4 matrice basée sur la proportion des transitions d' un état A à A, A à B, etc. Appelez cette matrice . M 2 devrait alors être la matrice de transition en deux étapes: A à A en 2 étapes, et ainsi de suite. Vous pouvez ensuite tester si votre matrice de transition en 2 étapes observée est similaire à M 2 .M M2 M2
Puisque vous avez beaucoup de données pour le nombre d'états, vous pouvez estimer partir de la moitié des données et tester M 2 à l'aide de l'autre moitié - vous testez les fréquences observées par rapport aux probabilités théoriques d'un multinomial. Cela devrait vous donner une idée de votre éloignement.M M2
Une autre possibilité serait de voir si les proportions d'état de base: proportion de temps passé en A, temps passé en B, correspond au vecteur propre de la valeur propre unitaire de M. Si votre série a atteint une sorte d'état stationnaire, la proportion de temps dans chaque l'État devrait tendre vers cette limite.
la source
Au-delà de la propriété de Markov (MP), une autre propriété est l' homogénéité temporelle (TH): peut être Markov mais avec sa matrice de transition P ( t ) en fonction du temps t . Par exemple, cela peut dépendre du jour de la semaine à t si les observations sont quotidiennes, puis une dépendance X t à X t - 7 conditionnelle à X t - 1 peut être diagnostiquée si TH est indûment supposé.Xt P(t) t t Xt Xt−7 Xt−1
En supposant que TH se vérifie, une vérification possible de MP teste que est indépendant de X t - 2 conditionnel à X t - 1 , comme Michael Chernick et StasK l'ont suggéré. Cela peut être fait en utilisant un test pour la table de contingence. On peut construire les n tables de contingence de X t et X t - 2 conditionnellement à { X t - 1 = x j } pour les n valeurs possibles x jXt Xt−2 Xt−1 n Xt Xt−2 {Xt−1=xj} n xj et tester l'indépendance. Cela peut également être fait en utilisant
avec ℓ > 1 à la place de X t - 2 .Xt−ℓ ℓ>1 Xt−2
Dans R, les tableaux de contingence ou les tableaux sont facilement produits grâce au facteur installation et les fonctionsp(Xt|Xt−1=xj,Xt−2=xi) i j comme l'index de colonne dans le treillis devrait sous MP conduire à des distributions similaires dans une colonne.
apply
,sweep
. L'idée ci-dessus peut également être exploitée graphiquement. Les packages ggplot2 ou lattice fournissent facilement des tracés conditionnels pour comparer les distributions conditionnelles . Par exemple, définir i comme index de ligne et jLe chap. 5 du livre L'analyse statistique des processus stochastiques dans le temps par JK Lindsey contient d'autres idées pour vérifier les hypothèses.
]
la source
Je pense que placida et mpiktas ont tous deux donné des approches très réfléchies et excellentes.
La statistique de test serait alors la différence entre ces proportions estimées. La complication de la comparaison standard des séquences de Bernoulli est qu'elles sont corrélées. Mais vous pouvez faire un test d'amorçage des proportions binomiales dans ce cas.
la source
la source