J'aimerais pouvoir concevoir un classifieur capable de faire la distinction entre différents types de conversations (sans nécessairement dire quoi que ce soit sur l'humeur, la sincérité ou le résultat, c'est un peu trop tiré par les cheveux).
Savoir, par exemple, que parmi 50 échantillons de conversations, 10 impliquent les deux parties à la recherche d'informations sur un événement futur, 30 semblent n'avoir aucun objectif, et 10 impliquent une partie à la recherche d'informations d'une autre sur un événement passé (en réalité, l'algorithme classerait ces types I, II ou III sans tenir compte des circonstances réelles).
En d'autres termes, l'ordre des locuteurs importerait avec le contenu, peut-être aidé en semant l'algorithme avec certains mots clés.
Existe-t-il un système de classification qui pourrait effectuer cette tâche avec un degré de précision assez élevé?
Réponses:
C'est ainsi que je l'aborderais. Vous devez en fait vérifier si un texte est dans la classe I ou III (sinon ce serait la classe II).
Si vous avez un ensemble de données d'apprentissage assez grand, vous pouvez facilement savoir quels sont les deux sacs de mots, ainsi que les deux seuils pour eux.
la source