Différence entre l'analyseur de circonscription et l'analyseur de dépendances

114

Quelle est la différence entre un analyseur de circonscription et un analyseur de dépendances ? Quels sont les différents usages des deux?

RAVI
la source

Réponses:

191

Un arbre d'analyse de circonscription divise un texte en sous-phrases. Les non-terminaux dans l'arborescence sont des types de phrases, les terminaux sont les mots de la phrase et les bords ne sont pas étiquetés. Pour une phrase simple "John voit Bill", une analyse de circonscription serait:

                  Sentence
                     |
       +-------------+------------+
       |                          |
  Noun Phrase                Verb Phrase
       |                          |
     John                 +-------+--------+
                          |                |
                        Verb          Noun Phrase
                          |                |
                        sees              Bill

Une analyse des dépendances relie les mots en fonction de leurs relations. Chaque sommet de l'arborescence représente un mot, les nœuds enfants sont des mots qui dépendent du parent et les arêtes sont étiquetées par la relation. Une analyse de dépendance de «John voit Bill» serait:

              sees
                |
        +--------------+
subject |              | object
        |              |
      John            Bill

Vous devez utiliser le type d'analyseur qui vous rapproche le plus de votre objectif. Si vous êtes intéressé par des sous-phrases dans la phrase, vous voudrez probablement l'analyse de la circonscription. Si vous êtes intéressé par les relations de dépendance entre les mots, vous souhaiterez probablement l'analyse des dépendances.

L'analyseur de Stanford peut vous donner l'un ou l'autre ( démo en ligne ). En fait, la façon dont cela fonctionne vraiment est de toujours analyser la phrase avec l'analyseur de circonscription, puis, si nécessaire, il effectue une transformation déterministe (basée sur des règles) sur l'arbre d'analyse de circonscription pour la convertir en un arbre de dépendances.

Plus peut être trouvé ici:

http://en.wikipedia.org/wiki/Phrase_structure_grammar

http://en.wikipedia.org/wiki/Dependency_grammar

dhg
la source
En ce qui concerne NLP, où se trouve l'application d'analyse des constituants? L'analyse des dépendances est très utile, mais où puis-je utiliser exactement la sortie d'analyse des constituants?
arjun
4
> Les approches d'analyse basées sur les constituants fournissent des informations similaires, mais elles doivent souvent être distillées à partir des arbres via des techniques telles que les règles de recherche de tête décrites au chapitre 11. web.stanford.edu/~jurafsky/slp3/11.pdf
gkiko
1
@arjun il existe de nombreuses applications pour l'analyse des constituants. Pour n'en citer qu'un exemple ici, dans l'extraction d'informations / de relations à partir de texte, vous devrez peut-être uniquement extraire des VP / NP / Clauses du texte, puis classer les paires de ces phrases / clauses comme indiquant ou non un type de relation. Donc, dans ce cas, je n'ai pas nécessairement besoin des informations de relation à granularité fine dans une phrase / clause, mais j'ai juste besoin que la phrase / clause s'étend du texte. Et c'est à ce moment qu'un analyseur de circonscription est utile.
Pedram