Langues reconnues par les DFA de taille polynomiale

23

Pour un alphabet fini fixe , un langage formel sur est régulier s'il existe un automate fini déterministe (DFA) sur qui accepte exactement .L ΣΣLΣLΣL

Je m'intéresse aux langues qui sont "presque" régulières dans le sens où elles peuvent être reconnues par des familles d'automates de taille qui ne croissent que de façon polynomiale avec la longueur du mot.

Formellement, permettez-moi de dire qu'un langage formel est reconnu par une famille DFA si pour chaque mot , laissant, est dans si accepte (peu importe si les autres acceptent ou non), et permettez-moi de définir les langues p-régulières comme des langues reconnues par une famille DFA calculable de taille polynomiale, à savoir, là est un polynôme tel que pour toutL w Σ n = | w | w L A n w A i(An)wΣn=|w|wLAnwAiP | A n | P ( n ) n(An)P|An|P(n)n. (Ce nom, "p-regular", est quelque chose que j'ai inventé, ma question est de savoir si un autre nom existe déjà pour cela. Notez que ce n'est pas la même chose que les langages p-regular au sens d' automates de permutation .)

Cette classe de langues p-régulières comprend bien sûr les langues régulières (il suffit de prendre pour tout , où est un DFA reconnaissant la langue régulière); mais c'est un sur-ensemble strict: par exemple, il est bien connu que est hors contexte mais pas régulier, mais c'est p- régulier ( doit juste compter occurrences de et occurrences de ). Cependant, comme j'exige que les automates soient des DFA de taille polynomiale , certains langages formels (en fait certains langages sans contexte) ne sont pasn A { a n b nn N } A n n a n bAn=AnA{anbnnN}Annanbp-regular: par exemple, la langue des palindromes n'est pas p-regular, car, intuitivement, lorsque vous avez lu la première moitié d'un mot, vous devez avoir autant d'états différents qu'il y a de mots possibles, car vous aurez besoin pour correspondre exactement à cette première moitié avec la seconde.

Ainsi, la classe des langues p-régulières est un sur-ensemble strict de langues régulières qui est incomparable avec les langues sans contexte. En fait, il semble que l'on puisse même obtenir une hiérarchie de langues en distinguant les langues p-régulières en fonction du plus petit degré du polynôme pour lequel elles sont régulières. Il n'est pas trop difficile de construire des exemples pour montrer que cette hiérarchie est stricte; bien que je ne comprenne pas encore bien l'interaction entre cela, et une définition alternative de la hiérarchie qui limiterait également la complexité du calcul de l' .P A nPPAn

Ma question est: cette classe que j'appelle p-regular, et la hiérarchie associée, a-t-elle été étudiée auparavant? Si oui, où et sous quel nom?

(Un lien possible est avec le champ ou le streaming, ou les algorithmes en ligne. Dans la terminologie des algorithmes de streaming pour les problèmes de reconnaissance de langue , je suis intéressé par la classe (ou la hiérarchie) des langues qui peuvent avoir des algorithmes de reconnaissance déterministes en une passe, en utilisant un nombre polynomial d'états (donc une taille de mémoire logarithmique), mais je n'ai trouvé aucune définition de cette classe dans cet article ou dans des articles connexes. Notez, cependant, que dans ma formulation du problème, la longueur du mot est connue à l'avance , ce qui est moins naturel dans un contexte de streaming: en streaming, vous pouvez voir cela comme un automate infini, un symbole spécial de "fin de mot" et une contrainte que le nombre d'états accessibles après la lecture de caractères est polynomial ennnn. Je pense que cette distinction fait une différence, exemple possible: langage de mots binaires dont la valeur est divisible par leur longueur, ce qui est facile pour une longueur fixe mais (je suppose) ne peut pas être représenté par un automate infini dans le sens précédent car pas d'identifications peut être faite si la longueur n'est pas connue à l'avance.)

(La motivation de cette classe p-régulière est que certains problèmes, tels que la probabilité d'appartenance à une langue pour les mots probabilistes, semblent être PTIME non seulement lorsque la langue est régulière, mais aussi quand elle est p-régulière, et j'essaie pour caractériser exactement dans quelles circonstances ces problèmes sont traitables.)

a3nm
la source
1
Argh, je n'avais pas réfléchi à la question de la calculabilité du . Merci de l'avoir signalé. Je viens d'ajouter l'exigence qu'ils soient calculables. Si tout va bien il n'y a aucune mauvaise situation des langues p-régulières qui doivent employer des familles calculables mais de grande complexité ? ( A n )(An)(An)
a3nm
1
Ok, j'ai supprimé le commentaire "non calculable". Mais même avec la contrainte calculable, vous pouvez toujours obtenir des choses étranges comme: choisissez et est NEXP-complet ( sinon). Peut-être pouvez-vous le restreindre en ajoutant la contrainte que doit être calculable en temps polynomial?!? B A n = A nAn={1nnB}BAn=An
Marzio De Biasi
1
Marzio: Argh, vous avez raison. Pour ma motivation, la bonne idée est que les sont calculables en PTIME, oui, alors j'ai changé pour ça ... encore, cela me dérange un peu que la complexité du calcul de ait une telle influence sur la classe résultante (car cela signifie que c'est un choix supplémentaire qui doit être fait dans la définition ...). Cela complique également l'image de la hiérarchie à laquelle je pensais. ( A n )An(An)
a3nm
2
Je ne vois pas ce qui ne va pas avec la non-calculabilité, ce que vous définissez est une classe de langage non uniforme, comme de nombreuses classes de circuits.
domotorp
3
Si vous renforcez la condition d'uniformité de l'espace de journal, toutes ces langues seront calculables dans l'espace de journal. Selon la définition donnée, tous les langages p-réguliers sont en «P-uniforme L» (reconnaissable par une famille de programmes de branchement P-uniforme, ou par un logspace TM avec un conseil calculable par ptime).
Emil Jeřábek soutient Monica

Réponses:

3

la question ne semble pas avoir été beaucoup étudiée (une possibilité est d'essayer de trouver une relation avec une classe de complexité "proche" disons P / poly, etc.); bien que voici au moins une référence qui la touche:

  • Opérations langagières avec expressions régulières de taille polynomiale Gruber / Holzer

    Ce travail traite des questions concernant la mesure dans laquelle les opérations de langage préservant la régularité affectent la complexité descriptive des expressions régulières. Certaines opérations de langage sont identifiées qui sont réalisables pour les expressions régulières dans le sens où le résultat de l'opération peut être représenté comme une expression régulière de polynôme de taille dans celle des opérandes. Nous prouvons que la prise de quotients de langue, en particulier les fermetures de préfixe et de suffixe, d'un ensemble régulier peut entraîner au maximum une explosion quadratique sur la taille d'expression requise. L'opération de décalage circulaire ne peut entraîner qu'une augmentation cubique de la taille et au moins un ballonnement quadratique peut être nécessaire dans le pire des cas.

comme AS le suggère, il peut y avoir d'autres façons plus naturelles d'étudier quelque chose comme la question posée. voici une autre façon quelque peu similaire d'étudier la croissance d'une langue régulière basée sur le nombre de mots de taille qui a une certaine relation lâche avec la question par exemplen

vzn
la source
4
Bien qu'il n'y soit pas explicitement indiqué, la preuve du résultat principal de l'article suivant implique que la classe des langues p-régulières n'est pas contenue dans le monotone NC ^ 1. H. Gruber et J. Johannsen: «Optimal Lower Bounds on Regular Expression Size using Communication Complexity», FoSSaCS 2008, LNCS 4962, pp. 273-286. hermann-gruber.com/data/fossacs08.pdf
Hermann Gruber
1
addendum, a traversé cette thèse de doctorat 2010 classes de complexité des automates finis / Kralovic qui définit quelque chose de similaire à ce qui est demandé pour p11 re "petits langages". il semble qu'une étude complète de ce domaine global et construit un cadre théorique général / abstractions de concepts connexes. cependant, ne voient pas beaucoup de théorèmes se rapportant directement à la classe spécifique des "familles DFA de taille P".
vzn
1
@vzn: La définition en p11 de la thèse de Kralovic est un peu différente car il s'agit de familles de langues, alors que dans ma question les différentes langues sont des mots de longueur fixe tirés d'une seule langue principale. Je ne suis pas sûr non plus du lien avec le papier Gruber et Holzer que vous donnez, je ne vois pas comment dans ma question vous pourriez penser que les automates sont le résultat d'opérations de préservation de la régularité en général. Quant à Gawrychowski et al, je suis d'accord qu'il pourrait être lié tangentiellement.
a3nm
2
la référence Gruber / Holzer semble aider à l'idée de réductions P-régulières par rapport aux propriétés de type "fermeture P-régulière". d'accord votre def semble différente de toute autre chose étudiée. en d'autres termes, il y a probablement des réductions entre certains de ces problèmes / classes et les arbitres vont dans ces directions et on pourrait chercher des opérations similaires à celles qui relient votre def aux classes précédemment étudiées / publiées (convenu que votre defn n'implique pas de particulier opérations de réduction). peut-être que la réponse stricte à votre question est "non, votre classe n'a pas été étudiée exactement"
vzn