Quali caratteristiche vengono generalmente utilizzate dagli alberi di analisi nel processo di classificazione nella PNL?


13

Sto esplorando diversi tipi di strutture ad albero di analisi. Le due strutture ad albero di analisi ampiamente conosciute sono a) Albero di analisi basato sul collegio elettorale eb) Strutture ad albero di analisi basate sulla dipendenza.

Sono in grado di utilizzare generare entrambi i tipi di strutture ad albero di analisi utilizzando il pacchetto NLP Stanford. Tuttavia, non sono sicuro di come utilizzare queste strutture ad albero per il mio compito di classificazione.

Ad esempio, se voglio fare un'analisi del sentimento e classificare il testo in classi positive e negative, quali caratteristiche posso derivare dalle strutture dell'albero di analisi per il mio compito di classificazione?

Risposte:


9

Usando un albero di analisi, dividi la frase in parti. Supponiamo che, nell'esempio dell'analisi del sentiment, puoi usare quelle parti per assegnare un sentimento positivo / negativo a ciascuna parte e quindi ottenere l'effetto cumulativo di quelle parti.

analisi del sentiment

Questa immagine ti aiuterà a capire di più. La prima metà ha un sentimento negativo (principalmente a causa della parola "secco") ma a causa della parola "ma" e dell'uso della parola "goduto", il sentimento negativo si trasforma in un sentimento positivo.

Per quanto riguarda il loro utilizzo, puoi semplicemente generare una rappresentazione vettoriale di parole delle singole parole nella frase e utilizzare i neuroni al posto dei nodi principali. Ogni neurone dovrebbe essere collegato a un altro neurone attraverso i pesi. Tutti i nodi foglia saranno rappresentazioni vettoriali di parole delle parole della frase. Il neurone genitore superiore (in questo caso il simbolo blu + in alto) dovrebbe generare un sentimento positivo / negativo secondo la frase. Questa struttura ad albero può essere addestrata in modo controllato.

Leggi questo documento per una comprensione più approfondita.

Crediti immagine: cs224.stanford.edu


1

Penso che le dipendenze possano essere utilizzate per migliorare l'accuratezza del tuo classificatore di sentimenti. Considera i seguenti esempi:

E1: Bill non è uno scienziato

e supponiamo che lo "scienziato" simbolico abbia un sentimento positivo in un dominio specifico.

Conoscendo la dipendenza neg (scienziato, non) possiamo vedere che l'esempio sopra ha un sentimento negativo. Senza conoscere questa dipendenza probabilmente classificheremmo la frase come positiva.

Altri tipi di dipendenze possono essere usati probabilmente allo stesso modo per migliorare l'accuratezza dei classificatori.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.