Differenza tra parser di circoscrizione e parser di dipendenze

114

Qual è la differenza tra un parser di circoscrizione e un parser di dipendenze ? Quali sono i diversi utilizzi dei due?

parsing nlp

— RAVI
fonte

191

Un albero di analisi del collegio elettorale suddivide un testo in sotto-frasi. I non terminali nell'albero sono tipi di frasi, i terminali sono le parole nella frase e i bordi sono privi di etichetta. Per una semplice frase "John vede Bill", un'analisi del collegio elettorale sarebbe:

                  Sentence
                     |
       +-------------+------------+
       |                          |
  Noun Phrase                Verb Phrase
       |                          |
     John                 +-------+--------+
                          |                |
                        Verb          Noun Phrase
                          |                |
                        sees              Bill

Un'analisi delle dipendenze collega le parole in base alle loro relazioni. Ogni vertice dell'albero rappresenta una parola, i nodi figlio sono parole che dipendono dal genitore e i bordi sono etichettati dalla relazione. Un'analisi delle dipendenze di "John vede Bill", sarebbe:

              sees
                |
        +--------------+
subject |              | object
        |              |
      John            Bill

Dovresti usare il tipo di parser che ti avvicina al tuo obiettivo. Se sei interessato a sotto-frasi all'interno della frase, probabilmente vuoi che il collegio elettorale parse. Se sei interessato alle relazioni di dipendenza tra le parole, probabilmente vorrai l'analisi delle dipendenze.

Il parser di Stanford può darti entrambi ( demo online ). In effetti, il modo in cui funziona davvero è analizzare sempre la frase con il parser del collegio elettorale e quindi, se necessario, esegue una trasformazione deterministica (basata su regole) sull'albero di analisi della circoscrizione per convertirlo in un albero delle dipendenze.

Altro può essere trovato qui:

http://en.wikipedia.org/wiki/Phrase_structure_grammar

http://en.wikipedia.org/wiki/Dependency_grammar

— DHG
fonte

Rispetto alla PNL, dov'è la domanda per l'analisi dei costituenti? L'analisi delle dipendenze è molto utile, ma dove posso utilizzare esattamente l'output dell'analisi dei componenti?

— arjun

> Gli approcci all'analisi basati sui costituenti forniscono informazioni simili, ma spesso devono essere distillate dagli alberi tramite tecniche come le regole di ricerca della testa discusse nel Capitolo 11. web.stanford.edu/~jurafsky/slp3/11.pdf

— gkiko

@arjun ci sono molte applicazioni per l'analisi dei componenti. Solo per citarne uno come esempio qui, nell'estrazione di informazioni / relazioni dal testo, potrebbe essere necessario solo estrarre VP / NP / Clausole dal testo e quindi classificare le coppie di queste frasi / clausole come indicative di un tipo di relazione o meno. Quindi, in questo caso, non ho necessariamente bisogno delle informazioni sulla relazione a grana fine all'interno di una frase / clausola, ma ho solo bisogno che la frase / clausola si estenda dal testo. Ed è allora che un parser di circoscrizione torna utile.

— Pedram