Apprentissage automatique sans contre-exemples

13

Dans le cadre d'apprentissage des automates d'Angluin , un étudiant vise à apprendre une langue régulière en posant deux types de questions à son professeur:LΣ

Requêtes de mots: étant donné , ?wΣwL

Requêtes d'équivalence: étant donné un langage , est ? Dans le cas contraire, l'enseignant donne un contre, par exemple un mot .KΣK=LwKLLK

En utilisant l'algorithme d'Angluin, l'étudiant apprend avec de nombreuses requêtes polynomiales dans le nombre d'états du DFA minimal de et la taille des contre-exemples.LL

Maintenant, considérons un scénario restreint où l'enseignant ne donne plus de contre-exemples. Est-il encore possible d'apprendre L avec un nombre polynomial de requêtes? Je suppose que ce n'est pas le cas parce que pour chaque séquence de requêtes et réponses de longueur polynomiale, on peut trouver plusieurs langues régulières cohérentes avec les réponses.

Quelqu'un voit-il comment le prouver?

user49692
la source

Réponses:

20

Considérez les automates de mot de passe : pour chaque , le DFA accepte la langue . Dans ce cas, une requête d'appartenance est identique à une requête d'équivalence --- et clairement, vous en aurez besoin exponentiellement pour trouver "l'aiguille dans la botte de foin". (C'est même si l'apprenant sait à l'avance que l'automate cible est de cette forme.) Pour une preuve formelle, un enseignant pourrait simplement répondre aux requêtes d'appartenance / équivalence avec NO, en choisissant de manière adaptative le automate cible comme unique possibilité restante.w{0,1}nMw{w}2n-1

Mise à jour. J'ai négligé de mentionner que l'automate de mot de passe a états et peut être appris en utilisant une seule requête d'équivalence Angluin standard (à savoir, avec le candidat comme automate vide).n+1M

Aryeh
la source
1

Mark Gold a en effet prouvé cette affirmation dans son article fondateur "Language Identification in the Limit". C'est un résultat bien connu maintenant. Vous pouvez trouver plus d'informations à ce sujet dans le livre de Colin de La Higuera sur l'inférence grammaticale.

Roman Manevitch
la source