Quelles fonctionnalités sont généralement utilisées à partir des arbres d'analyse dans le processus de classification en PNL?

13

J'explore différents types de structures d'arbres d'analyse. Les deux structures d'arbre d'analyse largement connues sont: a) l'arbre d'analyse basé sur les circonscriptions et b) les structures d'arbre d'analyse basées sur les dépendances.

Je suis capable d'utiliser les deux types de structures d'arbre d'analyse en utilisant le package Stanford NLP. Cependant, je ne sais pas comment utiliser ces structures arborescentes pour ma tâche de classification.

Par exemple, si je veux faire une analyse des sentiments et que je souhaite classer le texte en classes positives et négatives, quelles fonctionnalités puis-je tirer des structures d'arborescence d'analyse pour ma tâche de classification?

travail
la source

Réponses:

9

En utilisant un arbre d'analyse, vous divisez votre phrase en parties. Supposons que, dans l'exemple d'analyse des sentiments, vous pouvez utiliser ces parties pour affecter un sentiment positif / négatif à chaque partie, puis prendre l'effet cumulatif de ces parties.

analyse des sentiments

Cette image vous aidera à mieux comprendre. Le premier semestre a un sentiment négatif (principalement à cause du mot "sec") mais à cause du mot "mais" et de l'utilisation du mot "apprécié", le sentiment négatif est transformé en un sentiment positif.

Quant à les utiliser, vous pouvez simplement générer une représentation vectorielle de mots des mots individuels dans la phrase et utiliser des neurones à la place des nœuds parents. Chaque neurone doit être connecté à un autre neurone par des poids. Tous les nœuds feuilles seront les représentations vectorielles des mots de la phrase. Le neurone parent supérieur (dans ce cas, le symbole bleu + supérieur) devrait générer un sentiment positif / négatif selon la phrase. Cette structure arborescente peut être entraînée de manière supervisée.

Lisez cet article pour plus de compréhension.

Crédits image: cs224.stanford.edu

Azrael
la source
1

Je pense que les dépendances peuvent être utilisées pour améliorer la précision de votre classificateur de sentiments. Considérez les exemples suivants:

E1: Bill n'est pas un scientifique

et supposons que le "scientifique" symbolique a un sentiment positif dans un domaine spécifique.

Connaissant la dépendance négative (scientifique, non), nous pouvons voir que l'exemple ci-dessus a un sentiment négatif. Sans connaître cette dépendance, nous classerions probablement la phrase comme positive.

D'autres types de dépendances peuvent être utilisés probablement de la même manière pour améliorer la précision des classificateurs.

Pasmod Turing
la source