Nombre de mots d'une longueur donnée dans une langue régulière

Existe-t-il une caractérisation algébrique du nombre de mots d'une longueur donnée dans une langue régulière?

Wikipédia énonce un résultat quelque peu imprécis:

Pour tout langage régulier il existe des constantes et des polynômes tels que pour tout le nombre de les mots de longueur dans satisfont à l'équation . $L$ $\lambda_1,\,\ldots,\,\lambda_k$ $p_1(x),\,\ldots,\,p_k(x)$ $n$ $s_L(n)$ $n$ $L$ $s_L(n)=p_1(n)\lambda_1^n+\dotsb+p_k(n)\lambda_k^n$

Il n'est pas indiqué dans quel espace les vivent ( , je suppose) et si la fonction doit avoir des valeurs entières non négatives sur l'ensemble de . Je voudrais une déclaration précise et un croquis ou une référence pour la preuve. $\lambda$ $\mathbb{C}$ $\mathbb{N}$

Question bonus: l'inverse est-il vrai, c'est-à-dire étant donné une fonction de cette forme, y a-t-il toujours une langue régulière dont le nombre de mots par longueur est égal à cette fonction?

_{Cette question généralise Nombre de mots dans la langue régulière $(00)^*$}

formal-languages regular-languages word-combinatorics Gilles 'SO- arrête d'être méchant'
la source

un croquis d'une preuve est ici

Artem Kaznatcheev

@ArtemKaznatcheev Intéressant, merci. Envisageriez-vous de déplacer votre réponse à cette question, à laquelle elle correspond mieux?

Gilles 'SO- arrête d'être méchant'

Je pense que cette question est un peu redondante (bien que plus générale). Généraliser mon approche de la preuve est un peu poilu, mais je vais jeter un œil après le dîner.

Artem Kaznatcheev

@ArtemKaznatcheev Merci. J'ai rencontré des difficultés avec la deuxième partie de votre réponse, qui s'étend aux DFA réductibles.

Gilles 'SO- arrête d'être méchant'

@vzn C'est un fait classique que la fonction génératrice du nombre de mots dans une langue régulière est rationnelle, ce qui implique immédiatement la formule de l'OP (dans sa forme correcte). La partie difficile est d'extraire les asymptotiques. Pour plus de détails, vous pouvez consulter (par exemple) le livre Analytic Combinatorics mentionné dans ma réponse.

Yuval Filmus

Réponses:

Étant donné un langage régulier , considérons certains DFA acceptant , soit sa matrice de transfert ( est le nombre d'arêtes menant de l'état à l'état ), soit le vecteur caractéristique de l'état initial, et soit être le vecteur caractéristique des états accepteurs. Alors $L$ $L$ $A$ $A_{ij}$ $i$ $j$ $x$ $y$

s_{L} (n) = x^{T} A^{n} y .

$s_L(n) = x^T A^n y.$

Le théorème de Jordan indique que sur les nombres complexes, est similaire à une matrice avec des blocs de l'une des formes Si , alors le $A$

(\begin{matrix} λ \end{matrix}), (\begin{matrix} λ & 1 \\ 0 & λ \end{matrix}), (\begin{matrix} λ & 1 & 0 \\ 0 & λ & 1 \\ 0 & 0 & λ \end{matrix}), (\begin{matrix} λ & 1 & 0 & 0 \\ 0 & λ & 1 & 0 \\ 0 & 0 & λ & 1 \\ 0 & 0 & 0 & λ \end{matrix}), \dots

$\begin{pmatrix} \lambda \end{pmatrix}, \begin{pmatrix} \lambda & 1 \\ 0 & \lambda \end{pmatrix}, \begin{pmatrix} \lambda & 1 & 0 \\ 0 & \lambda & 1 \\ 0 & 0 & \lambda \end{pmatrix}, \begin{pmatrix} \lambda & 1 & 0 & 0 \\ 0 & \lambda & 1 & 0 \\ 0 & 0 & \lambda & 1 \\ 0 & 0 & 0 & \lambda \end{pmatrix}, \ldots$

λ \neq 0

$\lambda \neq 0$

n

$n$ Les puissances de ces blocs sont Voici comment nous sommes arrivés à ces formules: écrire le bloc comme . Les puissances successives de sont des diagonales secondaires successives de la matrice.

(\begin{matrix} λ^{n} \end{matrix}), (\begin{matrix} λ^{n} & n λ^{n - 1} \\ 0 & λ^{n} \end{matrix}), (\begin{matrix} λ^{n} & n λ^{n - 1} & (\binom{n}{2}) λ^{n - 2} \\ 0 & λ^{n} & n λ^{n - 1} \\ 0 & 0 & λ^{n} \end{matrix}), (\begin{matrix} λ^{n} & n λ^{n - 1} & (\binom{n}{2}) λ^{n - 2} & (\binom{n}{3}) λ^{n - 3} \\ 0 & λ^{n} & n λ^{n - 1} & (\binom{n}{2}) λ^{n - 2} \\ 0 & 0 & λ^{n} & n λ^{n - 1} \\ 0 & 0 & 0 & λ^{n} \end{matrix}), \dots

$\begin{pmatrix} \lambda^n \end{pmatrix}, \begin{pmatrix} \lambda^n & n\lambda^{n-1} \\ 0 & \lambda^n \end{pmatrix}, \begin{pmatrix} \lambda^n & n\lambda^{n-1} & \binom{n}{2} \lambda^{n-2} \\ 0 & \lambda^n & n\lambda^{n-1} \\ 0 & 0 & \lambda^n \end{pmatrix}, \begin{pmatrix} \lambda^n & n\lambda^{n-1} & \binom{n}{2}\lambda^{n-2} & \binom{n}{3}\lambda^{n-3} \\ 0 & \lambda^n & n\lambda^{n-1} & \binom{n}{2}\lambda^{n-2} \\ 0 & 0 & \lambda^n & n\lambda^{n-1} \\ 0 & 0 & 0 & \lambda^n \end{pmatrix}, \ldots$

B = λ + N

$B = \lambda + N$

N

$N$

λ

$\lambda$ commute avec ), Lorsque , le bloc est nilpotent, et nous obtenons les matrices suivantes (la notation est si et sinon):

N

$N$

B^{n} = (λ + n)^{N} = λ^{n} + n λ^{n - 1} N + (\binom{n}{2}) λ^{n - 2} N^{2} + \dots .

$B^n = (\lambda + n)^N = \lambda^n + n \lambda^{n-1} N + \binom{n}{2} \lambda^{n-2} N^2 + \cdots.$

λ = 0

$\lambda = 0$

[n = k]

$[n = k]$

1

$1$

n = k

$n=k$

0

$0$

(\begin{matrix} [n = 0] \end{matrix}), (\begin{matrix} [n = 0] & [n = 1] \\ 0 & [n = 0] \end{matrix}), (\begin{matrix} [n = 0] & [n = 1] & [n = 2] \\ 0 & [n = 0] & [n = 1] \\ 0 & 0 & [n = 0] \end{matrix}), (\begin{matrix} [n = 0] & [n = 1] & [n = 2] & [n = 3] \\ 0 & [n = 0] & [n = 1] & [n = 2] \\ 0 & 0 & [n = 0] & [n = 1] \\ 0 & 0 & 0 & [n = 0] \end{matrix})

$\begin{pmatrix} [n=0] \end{pmatrix}, \begin{pmatrix} [n=0] & [n=1] \\ 0 & [n=0] \end{pmatrix}, \begin{pmatrix} [n=0] & [n=1] & [n=2] \\ 0 & [n=0] & [n=1] \\ 0 & 0 & [n=0] \end{pmatrix}, \begin{pmatrix} [n=0] & [n=1] & [n=2] & [n=3] \\ 0 & [n=0] & [n=1] & [n=2] \\ 0 & 0 & [n=0] & [n=1] \\ 0 & 0 & 0 & [n=0] \end{pmatrix}$

En résumé, chaque entrée dans est soit de la forme ou de la forme , et nous en déduisons que pour certains polynômes complexes et complexes . En particulier, pour assez grand , C'est l'énoncé précis du résultat. $A^n$ $\binom{n}{k} \lambda^{n-k}$ $[n=k]$

s_{L} (n) = \sum_{je} p_{je} (n) λ_{je}^{n} + \sum_{j} c_{j} [n = j],

$s_L(n) = \sum_i p_i(n) \lambda_i^n + \sum_j c_j [n=j],$

λ_{i}, c_{j}

$\lambda_i,c_j$

p_{i}

$p_i$ $n$

s_{L} (n) = \sum_{je} p_{je} (n) λ_{je}^{n} .

$s_L(n) = \sum_i p_i(n) \lambda_i^n.$

Nous pouvons continuer et obtenir des informations asymptotiques sur , mais cela est étonnamment non trivial. S'il existe un unique de plus grande ampleur, disons , alors Les choses se compliquent quand il y a plusieurs de plus grande ampleur. Il se trouve que leur angle doit être rationnel (c'est-à-dire que jusqu'à la grandeur, ils sont les racines de l'unité). Si le LCM des dénominateurs est , alors l'asymptotique de sera très fonction du reste de modulo . Pour certains de ces restes, tous $s_L(n)$ $\lambda_i$ $\lambda_1$

s_{L} (n) = p_{1} (n) λ_{1}^{n} (1 + o (1)) .

$s_L(n) = p_1(n) \lambda_1^n (1 + o(1)).$

λ

$\lambda$

d

$d$

s_{L}

$s_L$

n

$n$

d

$d$

λ

$\lambda$ s de plus grande amplitude s'annulent, puis les asymptotiques "chutent", et nous devons répéter cette procédure. Le lecteur intéressé peut vérifier les détails dans Flajolet et Sedgewick's Analytic Combinatorics , Theorem V.3. Ils prouvent que pour certains , les entiers et les réels ,

d

$d$

p_{0}, \dots, p_{d - 1}

$p_0,\ldots,p_{d-1}$

λ_{0}, \dots, λ_{d - 1}

$\lambda_0,\ldots,\lambda_{d-1}$

s_{L} (n) = n^{p_{n (\mod ré)}} λ_{n (\mod ré)}^{n} (1 + o (1)) .

$s_L(n) = n^{p_{n\pmod{d}}} \lambda_{n\pmod{d}}^n (1 + o(1)).$

Yuval Filmus
la source

Soit une langue régulière et $L \subseteq \Sigma^*$

$\qquad \displaystyle L(z) = \sum\limits_{n \geq 0} |L_n|z^n$

sa fonction génératrice , où et donc . $L_n = L \cap \Sigma^n$ $|L_n|=s_L(n)$

On sait que est rationnel , c'est-à-dire $L(z)$

$\qquad \displaystyle \frac{P(z)}{Q(z)}$

avec les polynômes ; ceci est plus facile à voir en traduisant une grammaire linéaire droite pour en un système d'équations (linéaire!) dont la solution est . $P,Q$ $L$ $L(z)$

Les racines de sont essentiellement responsables de la, conduisant au formulaire indiqué sur Wikipédia. Ceci est immédiatement lié à la méthode des polynômes caractéristiques pour résoudre les récurrences (via la récurrence qui décrit ). $Q$ $|L_n|$ $(|L_n|)_{n \in \mathbb{N}}$

Raphael
la source

L_{n}

$L_n$

@Gilles Analytic Combinatorics , les livres d'Eilenberg, le livre de Berstel, Reutenauer

uli

@Gilles Automata-Theoretic Aspects of Formal Power Series.

uli

Q (z) = 1

$Q(z)=1$

k \geq n_{0}

$k \geq n_0$

@Raphael Oui, ma pensée était similaire ... cela semble être une lacune assez sérieuse dans la présentation du théorème, si elle ne s'applique pas aux langues finies, car (a) les langues finies sont régulières, (b) le théorème implique que les langues finies ne sont pas régulières, et (c) déterminer si une langue est finie est (en général) indécidable ... Je veux dire, Myhill-Nerode et le lemme de pompage n'ont pas ce problème; ils travaillent pour des langues finies.

Patrick87