Quelles sont les dernières méthodes pour former un chat bot?

11

Je voudrais former un bot qui utilise la saisie de texte, mémorise quelques catégories et répond aux questions en conséquence. En plus de la version 2.0, je veux que le bot réponde également aux entrées vocales. Quels sont les derniers algorithmes d'apprentissage automatique / IA disponibles pour le même? S'il vous plaît, faites-moi savoir.

bharadwaj aldur
la source
vérifier les réseaux de neurones à mémoire dynamique
riemann77
Pensez à utiliser le mappage mathématique symétrique .
Sergei

Réponses:

1

Votre question est incroyablement large - en réponse, deux cadres généraux que je vous encourage à examiner sont les suivants:

  1. Pour un développement de conversation de chatbot de pointe, http://rasa.ai est un framework open source plus adaptable que les systèmes basés sur des règles plus traditionnels.
  2. Pour la reconnaissance vocale, consultez https://discourse.mozilla.org/c/deep-speech qui est également open source.
Julian H
la source
0

Si votre bot se "souvient" de quelques catégories et répond ensuite aux questions, alors il est tout à fait inutile dans le scénario actuel. car dans ce cas, il fonctionne très mal sur un ensemble de données différent (ensemble de tests). en terminologie statistique, on parle de «surajustement». et en ce qui concerne la réponse aux questions, il n'y a pas de règle empirique pour définir des algorithmes «à la pointe de la technologie». bien que vous puissiez vérifier quelques modèles qui fonctionnaient bien sur babi ou des ensembles de données similaires comme les réseaux de mémoire dynamique ou les modèles seQ2seQ. pour avoir une idée de base de ce domaine, je vous suggère d'apprendre le jargon de base de l'apprentissage automatique, puis de passer à un cours de traitement avancé du langage naturel (stanford propose cs224n).

riemann77
la source
0

État d'AbuShawar et Atwell:

Un chatbot est un agent conversationnel qui interagit tour à tour avec les utilisateurs en utilisant le langage naturel. Différents chatbots ou systèmes de dialogue homme-ordinateur ont été développés en utilisant la communication orale ou textuelle et ont été appliqués dans différents domaines tels que: la recherche linguistique, l'éducation aux langues, le service client, l'aide sur le site Web et pour le plaisir.

Leurs articles et autres articles transmettent certaines des nombreuses approches contemporaines de la formation des chatbots à ce jour.

Extraction automatique des données de formation Chatbot à partir de corpus de dialogue naturel , Bayan AbuShawar, Eric Atwell, 2016

Cependant, la plupart des chatbots sont limités à la connaissance qui est manuellement dans leurs fichiers et à une langue naturelle spécifique qui est écrite ou parlée. Cet article présente le programme que nous avons développé pour convertir un texte lisible par machine (corpus) en un format de chatbot spécifique, qui est ensuite utilisé pour recycler un chatbot et générer un chat plus proche du langage humain. Différents corpus ont été utilisés: des corpus de dialogue tels que le British National Corpus of English (BNC); le livre saint de l'Islam Coran qui est un corpus de monologues où le verset et le vers suivant sont des tours; et la FAQ où les questions et réponses sont deux tours. L'objectif principal de ce processus d'automatisation est la capacité de générer différents prototypes de chatbot qui parlaient différentes langues en fonction du corpus.

Sélection de l'action du chatbot contextuelle-incertaine via l'apprentissage par renforcement auxiliaire paramétré , Chuandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun et Tenglun Tan, 2018

Nous proposons un chatbot sensible au contexte et un modèle d'apprentissage par renforcement (RL) pour former le chatbot. Le modèle proposé est nommé Criticalized Auxiliary Asynchronous Advantage Actor Critic (PA4C). Nous utilisons un simulateur d'utilisateur pour simuler l'incertitude de la confiance des utilisateurs dans un contexte de conversation. Par rapport aux approches naïves basées sur des règles, notre chatbot formé via le modèle PA4C évite la sélection d'actions artisanales et est plus robuste à la variance des énoncés des utilisateurs. Le modèle PA4C optimise les modèles RL conventionnels avec paramétrage d'action et tâches auxiliaires pour la formation de chatbot, qui répondent aux problèmes d'un grand espace d'action et d'états à récompense nulle. Nous évaluons le modèle PA4C au cours de la formation d'un chatbot pour les tâches de création d'événements de calendrier.

Formation sur le système d'apprentissage supervisé utilisant l'interaction Chatbot , publication de demande de brevet des États-Unis 0034828 A1, International Business Machines Corporation, Armonk, NY, États-Unis, 2019

Procédé mis en œuvre par ordinateur comprenant la réception et l'analyse d'un point de données pour déterminer les paramètres du point de données, la génération d'un ticket d'alerte sur la base de l'analyse du point de données, la communication, via un chatbot, au moins certaines informations contenues dans le ticket d'alerte à un ou plusieurs utilisateurs, et en catégorisant, via le chatbot, le point de données qui a abouti au ticket d'alerte en fonction du comportement d'un appareil qui a généré le point de données. Jonathan A. Cagadas, Alexander D. Lewitt, Simon D. Mikulcik, Karan Shukla, Leigh A. Williamson

Formation en deux étapes et codage-décodage mixte pour la mise en œuvre d'un chatbot génératif avec un petit corpus de dialogue , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016

Les modèles de chatbot génératifs basés sur des réseaux séquence à séquence peuvent générer des interactions de conversation naturelles si un énorme corpus de dialogue est utilisé comme données de formation. Cependant, à l'exception de quelques langues comme l'anglais et le chinois, il reste difficile de rassembler un grand corpus de dialogue. Pour résoudre ce problème, nous proposons un modèle de chatbot utilisant un mélange de mots et de syllabes comme unités de codage-décodage. De plus, nous proposons une méthode de formation en deux étapes, impliquant une pré-formation utilisant un grand corpus sans dialogue et une nouvelle formation utilisant un petit corpus de dialogue. Dans nos expériences, il a été démontré que les unités de mélange aident à réduire les problèmes de non-vocabulaire (OOV). De plus, la méthode de formation en deux étapes a été efficace pour réduire les erreurs grammaticales et sémantiques dans les réponses lorsque le chatbot a été formé à l'aide d'un petit corpus de dialogue (533,

Sélection de données inspirées de la submodularité pour la formation de chatbot orientée vers les objectifs basée sur les intégrations de phrases , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018

Les systèmes de compréhension du langage parlé (SLU), tels que les chatbots orientés vers les objectifs ou les assistants personnels, s'appuient sur un module initial de compréhension du langage naturel (NLU) pour déterminer l'intention et extraire les informations pertinentes des requêtes des utilisateurs qu'ils prennent en entrée. Les systèmes SLU aident généralement les utilisateurs à résoudre des problèmes dans des domaines relativement étroits et nécessitent une grande quantité de données de formation dans le domaine. Cela conduit à d'importants problèmes de disponibilité des données qui entravent le développement de systèmes performants. Pour atténuer ce problème, nous proposons une technique de sélection de données dans le régime de données faibles qui nous permet de nous entraîner avec moins de phrases étiquetées, donc des coûts d'étiquetage plus faibles. Nous proposons une fonction de classement de données inspirée de la sous-modularité, le gain marginal ratio-pénalité, pour sélectionner les points de données à étiqueter en fonction uniquement des informations extraites de l'espace d'intégration textuelle. Nous montrons que les distances dans l'espace d'intégration sont une source viable d'informations pouvant être utilisées pour la sélection des données. Notre méthode surpasse deux techniques d'apprentissage actif connues et permet une formation rentable de l'unité NLU. De plus, la technique de sélection que nous proposons n'a pas besoin d'être recyclée entre les étapes de sélection, ce qui la rend également efficace en temps.

Douglas Daseeco
la source
-1

Vous pouvez travailler avec des réseaux neuronaux récurrents avec LSTM ou GRU comme cellules de mémoire et incorporations de mots comme Word2vec. Les modèles de recherche de faisceau et d'attention peuvent également être utilisés avec les RNN pour plus de robustesse et moins de biais. Mais les résultats de ceux-ci ne sont appréciables dans une certaine mesure que dans la mesure où la recherche dans ce domaine est encore chaude et beaucoup à découvrir.

koushik
la source