Trouver la factorisation maximale des langues régulières

Que language soit régulier. $\mathcal{L} \subseteq \Sigma^*$

Une factorisation de est une paire maximale d'ensembles de mots avec $\mathcal{L}$ $(X,Y)$

$X \cdot Y \subseteq \mathcal{L}$
$X \neq \emptyset \neq Y$ ,

où | . $X \cdot Y = \{xy$ $x \in X, y \in Y\}$

$(X,Y)$ est maximal si pour chaque paire avec soit ou . $(X',Y') \neq (X,Y)$ $X'\cdot Y' \subseteq \mathcal{L}$ $X \not \subseteq X'$ $Y \not \subseteq Y'$

Existe-t-il une procédure simple pour savoir quelles paires sont maximales?

Exemple:

Soit $\mathcal{L} = \Sigma^∗ab \Sigma^∗$ . L'ensemble $F = \{u, v, w\}$ est calculé:

$u =(\Sigma^∗, \Sigma^∗ab\Sigma^∗)$
$v = (\Sigma^∗a\Sigma^∗, \Sigma^∗b\Sigma^∗)$
$w = (\Sigma^∗ab\Sigma^∗, \Sigma^∗)$

où $\Sigma = \{a,b\}$ .

Un autre exemple:

$\Sigma = \{a, b\}$ et $\mathcal{L} = \Sigma^*a\Sigma$ Ensemble de factorisation $F = \{q, r, s, t\}$ avec

$q = (\Sigma^*, \mathcal{L})$
$r = (\Sigma^*a, \Sigma + \mathcal{L})$
$s = (\Sigma^*aa, \epsilon + \Sigma + \mathcal{L})$
$t = (\mathcal{L}, \epsilon + \mathcal{L})$

algorithms regular-languages optimization Laura
la source

Je recommande la lecture de l'article suivant (en particulier la sous-section 4.1) de Jacques Sakarovitch

Cornelius Brand

Je me demande si vous souhaitez être plus précis sur le problème, c'est-à-dire la dernière phrase de votre question? On nous donne et nous voulons tester si est maximal? Notre tâche est-elle d'énumérer tous qui sont maximaux? Dans ce dernier cas, est-il clair que cette liste est finie ou de taille polynomiale? Il n'est probablement pas logique de demander un algorithme pour énumérer toutes les possibilités s'il y en a de manière exponentielle. De plus, voulez-vous spécifier comment le langage est représenté lorsqu'il nous est présenté, et comment sont représentés? (par exemple, DFA, NFA, regexp)

X, Y

$X,Y$

(X, Y)

$(X,Y)$

(X, Y)

$(X,Y)$

L

${\cal L}$

X, Y

$X,Y$

Je ne comprends pas vos exemples. Est-ce que censés être toutes les paires maximales? ne semble pas être valide ...

u, v, w

$u,v,w$

v

$v$

Raphael

L'exemple est tiré de l'article mentionné ci-dessus. sont supposés être des paires maximales. Je ne comprends pas non plus comment est calculé car il ne semble pas nécessairement être dans . Je posterai un autre exemple.

u, v, w

$u,v,w$

v

$v$

L

$\mathcal{L}$

Laura

@Raphael, il me semble que

est valide. Soit

est une factorisation, puisque

(considérons toute chaîne contenant un

, puis toute séquence de

et / / ou

, puis finalement un

: cette chaîne doit avoir un point où le premier

apparaît, donc c'est un point où elle contient

v

$v$

X = Σ^{*} a Σ^{*}

$X=\Sigma^* a \Sigma^*$

Y = Σ^{*} b Σ^{*}

$Y=\Sigma^* b \Sigma^*$

(X, Y)

$(X,Y)$

X \cdot Y = L

$X \cdot Y = {\cal L}$

a

$a$

a

$a$

b

$b$

b

$b$

b

$b$

). Je n'ai paspreuve qu'il est maximale, mais je ne peux pas trouver plus ensembles

qui sont une factorisation de

a b

$ab$

X^{'}, Y^{'}

$X',Y'$

L

${\cal L}$

Comme suggéré dans les commentaires à la question, je vais essayer de donner une réponse (malheureusement partielle) à la question, au moins dans la mesure où j'ai compris le problème moi-même (cela implique que vous pourriez bien trouver des erreurs, et si vous trouvez un moyen d'expliquer plus brièvement ou clairement l'un des points ci-dessous, n'hésitez pas à modifier la réponse en conséquence):

Tout d'abord, il convient de noter que nous n'avons pas réellement à calculer l'automate universel d'une langue si nous voulons calculer les factorisations d'une langue.

D'après l'article mentionné dans mon commentaire ¹, il existe une correspondance 1-1 entre les facteurs gauche et droit d'une langue régulière, c'est-à-dire, étant donné un facteur gauche de la langue, le facteur droit correspondant est uniquement déterminé et vice versa. Plus précisément, nous avons les éléments suivants:

Let est une factorisation de . Alors c'est-à-dire que tout facteur gauche est une intersection de quotients droits, et tout facteur droit est une intersection de quotients gauches. A l' inverse, une intersection de quotients gauche de est un facteur droit de , et toute intersection de droite quotients de est un facteur gauche de . $(X,Y)$ $L$

Y = ⋂_{x \in X} x^{- 1} L, X = ⋂_{y \in Y} L y^{- 1},

$Y = \bigcap_{x \in X}x^{-1}L, X = \bigcap_{y \in Y}Ly^{-1},$

L

$L$

L

$L$

L

$L$

L

$L$

Notez que pour une langue régulière, il n'y a qu'un ensemble fini de quotients gauche et droit, et donc ou le problème se réduit à calculer les quotients gauche et droit d'une langue, puis à calculer leur fermeture stable , c'est-à-dire un minimum surensemble des quotients qui est fermé sous l'intersection. Ceux - ci sont alors précisément les bons facteurs et les facteurs à gauche, et il est généralement facile de voir quelles paires sont des sous - ensembles de . $\cap$ $L$

Exemple

Afin d'illustrer les points ci-dessus, considérons le premier exemple de la question (dont je pense également qu'il est incorrect dans le document):

Soit . Maintenant, les quotients de gauche sont les ensembles pour , qui est, ces mots dans qui peut être préfixé par , soit . Quand pour distincts ? C'est le cas si et seulement si $L = \Sigma^\ast ab \Sigma^\ast$ $L$ $x^{-1}L$ $x\in \Sigma^\ast$ $u$ $\Sigma^\ast$ $x$ $xu \in L$ $y^{-1}L=x^{-1}L$ $x,y$ $x$ et peut être augmenté de mots en avec exactement les mêmes suffixes. Cela signifie, pour le dire en termes plus familiers, qu'ils sont équivalents à Nérode, et les suffixes nécessaires pour ajouter des mots dans une classe Nérode sont précisément les quotients de gauche respectifs. $y$ $L$

Pour , nous voyons que nos classes d'équivalence Nerode sont $L$

, l'ensemble de mots ne contenant pas comme facteur et se terminant par , $N_1$ $ab$ $a$
, l'ensemble de mots se terminant par et ne contenant pas comme facteur, et $N_2$ $b$ $ab$
, l'ensemble de mots contenant comme facteur, c'est-à-dire $N_3$ $ab$ $N_3 = L$

Ils peuvent être augmentés avec les ensembles suivants (c'est-à-dire que ce sont les quotients de gauche des mots dans les classes respectives):

pour dans compose de tous les mots dans (tout mot peut être augmenté d'un mot contenant comme facteur et devient ainsi un mot dans ) et , c'est-à-dire $S_1 = x^{-1}L$ $x$ $N_1$ $L$ $ab$ $L$ $b\Sigma^\ast$ $S_1 = L \cup b\Sigma^\ast$
pour dans est la langue elle-même, c'est-à-dire et $S_2 = x^{-1}L$ $x$ $N_2$ $S_2 = L$
pour dans est évidemment . Autrement dit, nous avons trouvé trois bons facteurs de . Comme , leur fermeture -stable est trivialement , et ce sont alors précisément les facteurs appropriés. $S_3 = x^{-1}L$ $x$ $N_3$ $\Sigma^\ast$ $L$ $S_2\subset S_1\subset S_3$ $\cap$ ${S_1,S_2,S_3}$

Par conséquent, notre ensemble de factorisation est de la forme . $\mathcal{F}_L$ $(P_1,S_1),(P_2,S_2),(P_3,S_3)$

Maintenant, pour les facteurs de gauche , nous utilisons les équations du début de cette réponse: $P_i$

P_{i} = ⋂_{x \in S_{i}} L x^{- 1}

$P_i = \bigcap_{x\in S_i} Lx^{-1}$

Pour , on obtient , pour nous obtenons et , on obtient . Vous pouvez le voir par inspection (l'excuse la plus populaire pour être trop paresseux pour énoncer une preuve formelle) ou en calculant explicitement les bons quotients (ce qui est assez analogue, mais pas complètement, au calcul des quotients de gauche). Nos factorisations sont donc données par où $P_1$ $L \cup \Sigma^\ast a$ $P_2$ $\Sigma^\ast$ $P_3$ $L$ $\mathcal{F}_L = {u,v,w}$

$u = (P_1,S_1) = (\Sigma^\ast ab \Sigma^\ast \cup \Sigma^\ast a, \Sigma^\ast ab \Sigma^\ast \cup b\Sigma^\ast)$
et $v = (P_2, S_2) = (\Sigma^\ast, \Sigma^\ast ab \Sigma^\ast)$
$w = (P_3, S_3) = (\Sigma^\ast ab \Sigma^\ast, \Sigma^\ast)$

Sommaire

Pour résumer (comme vous demandiez une procédure simple):

Pour le calcul des décompositions d'une langue , on calcule d' abord les quotients gauche de . $L$ $L$
Vous pouvez le faire, dans le langage de l'article, en construisant un DFA minimal pour puis pour chaque état dans (correspondant, en tant que classe d'équivalence de Nérode, à un quotient de gauche) calculer l'avenir de dans , obtenant ainsi un quotient gauche de la langue pour chaque état. $A$ $L$ $q$ $A$ $q$ $A$
La collection de quotients de gauche ainsi obtenue donne, en général, un sous-ensemble des facteurs de droite. $S_R$
Calculer ensuite la Fermeture -stable de , qui peut être fait dans la pratique , en formant l'intersection de tout sous - ensemble de et l' ajout d' un sous - ensemble ainsi obtenu à . $\cap$ $S_R$ $S_R$ $S_R$
L'ensemble en même temps que toutes les intersections de l'étape précédente est alors l'ensemble des facteurs de droite . $S_R$ $L$
Afin d'obtenir les facteurs de gauche, on peut calculer les quotients de droite . $L$
Ce sont des ensembles de la forme , pour . Maintenant, ce ne sont encore qu'un nombre fini, et pour , nous avons si et seulement si pour tout , , c'est-à-dire peut être préfixé aux mots de la langue avec exactement le même ensemble de chaînes. $Ly^{-1}$ $y\in \Sigma^\ast$ $x\neq y$ $Ly^{-1} = Lx^{-1}$ $u\in \Sigma^\ast$ $ux \in L \Leftrightarrow uy \in L$
Pour calculer , considérons ces états dans tels que soit contenu dans l'avenir de . L'union du passé de ces États constitue un bon quotient. Retrouvez tous ces quotients. $Lx^{-1}$ $q$ $A$ $x$ $q$
Vous savez que vous avez terminé lorsque vous avez trouvé autant de facteurs de gauche que de bons facteurs.
Trouvez les paires de facteurs à gauche et à droite tels que . Ceci est . $X,Y$ $X\cdot Y \subseteq L$ $\mathcal{F}_L$

The Universal Automaton de Lombardy et Sakarovitch (dans Texts in Logic and Games, Vol 2: Logic and Automata: History and Perspectives , 2007)

Cornelius Brand
la source

A \subseteq B

$A \subseteq B$

X

$X$

Y

$Y$

Trouver la factorisation maximale des langues régulières

Réponses:

Exemple

Sommaire