Quelles recherches ont été menées dans le domaine de «l’identification du sarcasme dans le texte»?

17

L'identification du sarcasme est considérée comme l'un des problèmes ouverts les plus difficiles dans le domaine du ML et de la NLP.

Alors, y a-t-il eu des recherches considérables sur ce front? Si oui, à quoi ressemble la précision? Veuillez également expliquer brièvement le modèle PNL.

Dawny33
la source
Aah, question intéressante (!)
ABcDexter

Réponses:

5

L'article d'enquête suivant par des chercheurs de l'IIT Bombay résume les avancées récentes dans la détection du sarcasme: Arxiv link .

En ce qui concerne votre question, je ne pense pas qu'elle soit considérée comme extrêmement difficile ou ouverte. Bien qu'il introduise une ambiguïté que les ordinateurs ne peuvent pas encore gérer, les humains sont facilement capables de comprendre le sarcasme et sont donc en mesure d'étiqueter les ensembles de données pour la détection du sarcasme.

Dur
la source
2

Il y a eu un travail récent dans le même domaine où les réseaux de neurones (CNN pour être précis) sont utilisés dans le même but. Quelques informations. à propos de la recherche est:

Pour apprendre ce contexte, l'article décrit une méthode par laquelle le réseau de neurones trouve les «imbrications» de l'utilisateur - c'est-à-dire des indices contextuels comme le contenu des tweets précédents, les intérêts et les comptes associés, etc. Il utilise ces différents facteurs pour tracer l'utilisateur avec d'autres et (idéalement) constate qu'ils forment des groupes relativement bien définis.

Ainsi, le papier utilise des CNN, des incorporations de mots et d'utilisateurs pour détecter le sarcasme dans le texte. Il y a aussi un article Techcrunch à ce sujet.

Le papier utilise le sentiment du tweet et se compare à celui des autres tweets similaires:

Si le sentiment du tweet semble en désaccord avec la majeure partie de ce qui est exprimé par des utilisateurs similaires, il y a de bonnes chances que le sarcasme soit utilisé.

Lien vers le papier

Dawny33
la source