Dans les langages de programmation, il existe un ensemble de règles de grammaire qui régissent la construction d'instructions et d'expressions valides. Ces règles aident à analyser les programmes écrits par l'utilisateur.
Peut-il jamais y avoir un ensemble de règles de grammaire fonctionnellement complet qui puisse analyser avec précision n'importe quelle instruction en anglais (spécifique aux paramètres régionaux) et qui peut éventuellement être implémenté pour être utilisé dans des projets basés sur l'IA?
Je sais qu'il y a beaucoup de boîtes à outils PNL disponibles en ligne, mais elles ne sont pas aussi efficaces. La plupart d'entre eux sont formés à l'aide de corpus spécifiques qui ne parviennent parfois pas à déduire des corrélations complexes entre différentes parties d'une expression.
En d'autres termes, ce que je demande, c'est que s'il est possible pour un ordinateur d'analyser une phrase bien versée écrite en anglais comme si elle avait été analysée par un humain anglophone adulte?
EDIT: S'il ne peut pas être représenté à l'aide de règles de grammaire simples, quel type de structure sémantique peut-on utiliser pour le généraliser?
EDIT2: Cet article prouve l'absence de context-freeness dans les langues naturelles. Je cherche une solution, même si elle est trop complexe.
la source
Réponses:
Analyser oui, très probablement non.
Pourquoi ?
Selon ma compréhension de la façon dont nous dérivons le sens des sons, il existe 2 stratégies complémentaires:
Règles de grammaire: Un système basé sur des règles pour ordonner les mots pour faciliter la communication, ici le sens est dérivé de l'interaction des sons discrets et de leur signification indépendante, vous pouvez donc analyser une phrase basée sur un livre de règles.
EG "Ce fut un triomphe" : l'analyseur extrait un pronom ( This ) avec le sens correspondant (une personne ou une chose spécifique); un verbe ( était ) avec une signification correspondante (s'est produit); ( a ) et ici nous commençons par quelques problèmes d'analyse, qu'extrait l'analyseur, un nom ou un article indéfini? Et donc nous consultons le livre de règles de grammaire et nous nous contentons du sens (article indéfini), vous devez analyser le mot suivant et y faire référence cependant, mais passons cela pour l'instant, et enfin ( triompheons ) un nom (il pourrait aussi s'agir d'un verbe, mais grâce au livre de règles de grammaire, nous nous sommes contentés d'un nom ayant un sens: (victoire, conquête), donc à la fin nous avons (joindre les significations):
Une chose spécifique s'est produite de la victoire. Assez proche et je passe sous silence quelques autres règles, mais ce n'est pas le but, l'autre stratégie est:
Un dictionnaire lexical (ou lexique) où les mots ou les sons sont associés à une signification spécifique. Ici, le sens est dérivé d'un ou plusieurs mots ou sons comme une unité. Cela introduit le problème à un analyseur, car il ne devrait rien analyser.
EG "Non Plus Ultra" Et donc l'analyseur AI reconnaîtrait que cette phrase ne doit pas être analysée et doit plutôt correspondre à une signification:
Le point culminant ou point culminant
Les unités lexicales introduisent un autre problème dans la mesure où elles pourraient elles-mêmes faire partie du premier exemple, et vous vous retrouvez donc avec une récursivité.
Je pense que cela pourrait être possible, la plupart des exemples que j'ai vus traitent efficacement du livre de règles de grammaire ou de la partie lexique, mais je ne suis pas au courant d'une combinaison des deux, mais en termes de programmation, cela pourrait arriver.
Malheureusement, même si vous résolvez ce problème, votre IA ne comprendrait pas vraiment les choses au sens strict, mais vous présenterait plutôt des synonymes très élaborés.En outre, le contexte (comme mentionné dans les commentaires) joue un rôle dans les stratégies de grammaire et de lexique.
Un mélange où il y a à la fois des règles de grammaire et un lexique et les deux peuvent changer et être influencés en fonction du contexte et de l'expérience spécifiques à l'IA ainsi qu'un système pour traiter ces objets pourrait être un moyen.
la source
Je suis à peu près sûr que la réponse est «non» au sens strict, car l'anglais n'a tout simplement pas de définition formelle. Autrement dit, personne ne contrôle l'anglais et publie une grammaire formelle à laquelle tout le monde est tenu d'adhérer. L'anglais se construit à travers un processus expérientiel et il a des contradictions et des défauts, mais la nature probabiliste de l'esprit humain nous permet de les contourner.
Par exemple, que cette "phrase":
Cette phrase pas de verbe
Techniquement, ce n'est pas du tout une phrase, car elle n'a pas de verbe. Mais est-ce que quelqu'un avait du mal à comprendre ce que cela signifiait? Douteux. Essayez de trouver une règle formelle pour cela. Et ce n'est qu'un exemple.
Maintenant, pourriez-vous trouver une grammaire formelle qui couvre, peut-être, 90% des cas, et qui est "assez bonne" pour la plupart des utilisations pratiques? Peut-être, peut-être même probablement. Mais je suis sûr qu'il n'est pas possible d'atteindre 100%.
la source
Nous avons conclu qu'il s'agit d'un problème circulaire à deux facettes: la structure ne peut pas être déduite sans contexte, mais la connaissance de la structure permet également de déduire le contexte. Alors, voici votre solution complexe: commencez par le contexte, qui est déterminé par la combinaison de mots dans la phrase (combinatoire et problème de recherche), à partir de là, déterminez votre structure, ou "analyser" (à cette étape, vous pouvez également filtrer certains mots insignifiants ou au moins leur attribuer des poids moindres), revenez au contexte, revenez à l'analyse, et ainsi de suite jusqu'à ce que vous arriviez à la signification. Ainsi, par réduction itérative et récursive, l'ensemble du problème peut être résolu.
la source
Je suis fortement en désaccord avec tous les anciens commentaires. Non pas parce qu'ils ont tort, ce qu'ils ne sont pas, mais parce qu'ils sont trompeurs, mais involontairement.
Par exemple: si l'on regarde ces problèmes d'un point de vue académique, les problèmes sembleront toujours insurmontables. En effet, tout est froidement évalué et calculé indépendamment de tout le reste.
La réponse réside principalement dans l' association de mots . Vous devez écrire un programme capable de traiter une vaste base de données de livres numériques, d'enregistrer chaque mot et tous les mots de cette langue qui lui sont associés. Plus toutes les informations statistiques avec chaque mot associé et sa ponctuation associée.
Cela vous donnera alors la base sur laquelle une IA peut décider de plusieurs choses:
Donc, en conclusion, vous devez rechercher deux choses: l'association et la probabilité.
Lors de la base de données numérique d'un modèle de langage, la possibilité de "chaînes" de mots et de phrases se produit, de sorte que chaque variation de la structure du langage dans une phrase donnée peut être déterminée avant, pendant et après qu'un échantillon de texte soit scribé. Ce contrôle intime sur les modèles de modèle de langage signifie que les composants sensibles tels que "sujet" et "objet" peuvent être facilement déterminés par le code.
la source