Cette expression régulière représente une chaîne de Markov sur états correspondant à un état de départ et à chacune des lettres. Une transition se fait de à , de à , ..., et de l'avant-dernière lettre à la dernière, toujours avec probabilité . Sinon, l'État reste le même. L'état final est un état absorbant: une fois atteint, toutes les lettres ont été observées dans l'ordre.m + 1ssuneunebp
En termes d'états , la matrice de transition est(s,a,b,…)
Pm=⎛⎝⎜⎜⎜⎜⎜⎜⎜1−p0⋮00p1−p0⋯00p⋱0⋯⋯⋯p1−p000⋮p1⎞⎠⎟⎟⎟⎟⎟⎟⎟
Les techniques algébriques linéaires standard (la forme normale de Jordan de et sa matrice de changement de base sont simples et clairsemées, ce qui le rend assez facile à faire) établissent que pour la dernière entrée de la première ligne de la puissance de la matrice estPmn≥mPnm
Pnm(1,m+1)=pm∑i=0n−m(m−1+im−1)(1−p)i.
C'est la chance d'atteindre l'état absorbant depuis l'état de départ après transitions: cela répond à la question. Si vous le souhaitez, elle peut être exprimée en "forme fermée" en termes de fonction hypergéométrique commen
Pnm(1,m+1)=1−pm(nm−1)(1−p)−m+n+12F1(1,n+1;n+2−m;1−p).
La somme a une interprétation combinatoire agréable. Soit la position à laquelle la dernière lettre apparaît en premier. Il est précédé d'une séquence (éventuellement vide) de non s, chacun ayant une chance de de se produire; puis un avec une probabilité de se produire; puis une séquence (éventuellement non vide) de non s, etc. Il y a emplacements où placer la première apparition d'un , puis la première apparition de a après cela, etc. Ainsi - y compris la première apparition de la dernière lettre en position - la probabilité estm+ia1−papb(m−1+im−1)abm+i(m−1+im−1)pm(1−p)k . Cela donne un terme de la somme. Ainsi, la somme décompose les séquences selon l'endroit où la dernière lettre apparaît en premier, qui peut être n'importe où de la position à sont évidemment disjoints - et additionne leurs probabilités.m+0m+(n−m)
Comme exemple simple pour clarifier l'interprétation, supposons et considérons . Il existe quatre séquences de trois symboles, chacune de probabilité , et trois autres séquences de probabilité , dans lesquelles les symboles et apparaissent dans l'ordre:m=2n=3p3p2(1−2p)ab
aab,aba,abb,bab;ab$,a$b,$ab.
La chance est donc
4p3+3p2(1−2p)=3p2−2p3=p2(3−2p)=p2(1+2(1−p))=P32(1,3).
L'interprétation combinatoire est que l'expression régulière ^ab
(avec en position ) se produit avec la probabilité ; et , avec en position , se produit de deux manières as et , chacune avec une probabilité .b2p2^[^a]*a[^b]*b
b3^a[^b]b
^[^a]ab
p2(1−p)