La lingua inglese può mai essere generalizzata usando una serie di regole grammaticali?


10

Nei linguaggi di programmazione, esiste una serie di regole grammaticali che regolano la costruzione di espressioni ed espressioni valide. Queste regole aiutano ad analizzare i programmi scritti dall'utente.

Può mai esserci un insieme funzionalmente completo di regole grammaticali in grado di analizzare accuratamente qualsiasi istruzione in inglese (specifica della locale) e che può essere eventualmente implementata per l'uso in progetti basati sull'intelligenza artificiale?

So che ci sono molti Toolkit NLP disponibili online, ma non sono così efficaci. Molti di loro sono addestrati usando specifici corpus che a volte non riescono a inferire alcune correlazioni complesse tra le varie parti di un'espressione.

In altre parole, quello che sto chiedendo è che se è possibile per un computer analizzare una frase ben scritta scritta in inglese come se fosse analizzata da un umano adulto di lingua inglese?

EDIT: Se non può essere rappresentato usando semplici regole grammaticali, che tipo di struttura semantica può essere usata per generalizzarla?

EDIT2: questo documento dimostra l'assenza di contestualità nei linguaggi naturali. Sto cercando una soluzione, anche se è troppo complessa.


2
Non ho i riferimenti per sostenerlo, ma penso che sia stato provato matematicamente che non puoi farlo-- che comprendere l'inglese richiede completamente segnali di contesto che richiedono un ragionamento semantico di livello superiore che non può essere contenuto in regole grammaticali.
antlersoft,

Secondo wikipedia la maggior parte delle lingue naturali sono libere dal contesto: en.wikipedia.org/wiki/…
inf3rno

Risposte:


8

Può mai esserci un insieme funzionalmente completo di regole grammaticali in grado di analizzare accuratamente qualsiasi istruzione in inglese (specifica della locale) e che può essere eventualmente implementata per l'uso in progetti basati sull'intelligenza artificiale?

Analizzalo sì, esattamente molto probabilmente no.

Perché ?

Secondo la mia comprensione su come deriviamo il significato dai suoni, ci sono 2 strategie complementari:

Regole grammaticali: un sistema basato su regole per ordinare parole per facilitare la comunicazione, qui il significato deriva dall'interazione di suoni discreti e dal loro significato indipendente, in modo da poter analizzare una frase basata su un libro di regole.

EG "Questo è stato un trionfo" : il parser avrebbe estratto un pronome ( Questo ) con significato corrispondente (una persona o cosa specifica); un verbo ( era ) con significato corrispondente (occorso); ( a ) e qui iniziamo con alcuni problemi di analisi, cosa estrarrebbe il parser, un sostantivo o un articolo indefinito? Quindi, consultiamo il libro delle regole grammaticali e ci accontentiamo del significato (articolo indefinito di uno qualsiasi), devi analizzare la parola successiva e fare riferimento ad essa però, ma per un po 'passiamo sopra quello per ora, e infine ( trionfiamo ) un sostantivo (potrebbe anche essere un verbo, ma grazie al libro delle regole grammaticali abbiamo optato per un sostantivo con significato: (vittoria, conquista), quindi alla fine abbiamo (unendo i significati):

È successa una cosa specifica della vittoria. Abbastanza vicino e sto sorvolando alcune altre regole, ma non è questo il punto, l'altra strategia è:

Un dizionario lessicale (o lessico) in cui parole o suoni sono associati a un significato specifico. Qui il significato deriva da una o più parole o suoni come unità. Questo introduce il problema in un parser, dal momento che non dovrebbe analizzare nulla.

EG "Non Plus Ultra" E così il parser AI riconoscerebbe che questa frase non deve essere analizzata e invece abbinata al significato:

Il punto più alto o culmine

Le unità lessicali introducono un altro problema in quanto esse stesse potrebbero far parte del primo esempio e quindi si finisce con la ricorsione.

se è possibile che un computer analizzi una frase ben versata scritta in inglese come se fosse analizzata da un umano adulto di lingua inglese?

Credo che potrebbe essere possibile, la maggior parte degli esempi che ho visto trattano in modo efficace il libro delle regole grammaticali o la parte del lessico, ma non sono a conoscenza di una combinazione di entrambi, ma in termini di programmazione potrebbe accadere.

Sfortunatamente anche se risolvessi questo problema, la tua IA non capirebbe davvero le cose in senso stretto, ma ti presenterebbe piuttosto sinonimi molto elaborati, inoltre il contesto (come menzionato nei commenti) gioca un ruolo nelle strategie grammaticale e lessicale.

Se non può essere rappresentato usando semplici regole grammaticali, che tipo di struttura semantica può essere usata per generalizzarla?

Un misto in cui ci sono sia regole grammaticali che un lessico ed entrambi possono cambiare ed essere influenzati in base al contesto e all'esperienza specifici dell'intelligenza artificiale, così come un sistema per gestire questi oggetti potrebbe essere un modo.


Il mio ambito di inglese è limitato all'uso formale. Se per una volta saltassimo entità molto complesse come metafore o modi di dire, definirebbe una grammatica sensibile al contesto raggiungerebbe lo scopo?
skrtbhtngr

@skrtbhtngr: bene, in teoria sì, sarebbe un sottoinsieme come lo è il linguaggio formale, il contesto sarà comunque il problema più difficile.
Keno,

Caso laterale: "È stato un trionfo" parlando di una moto per vari motivi (prima bici, bici bruciata), forse possiamo sostenere che ci vuole un carattere maiuscolo per distinguere il marchio da un nome.
Tensibai,

Concordo sul fatto che comprendere il significato del testo sia la parte difficile. Solo una semplice frase: "Peter è andato al cinema". contiene molte informazioni nascoste: Peter è un maschio, molto probabilmente è andato lì a guardare un film con la sua ragazza, la sua posizione è cambiata, ecc ... Costruire un modello ad esempio un grafico basato sul testo non è sufficiente, perché è non qualcosa di statico, può descrivere più linee temporali, eventi e contesti, inoltre ci sono informazioni nascoste in ogni frase che puoi dedurre e usare per comprendere la frase precedente o successiva.
inf3rno

2

Sono abbastanza sicuro che la risposta sia "no" nel senso più stretto, dal momento che l'inglese semplicemente non ha una definizione formale. Cioè, nessuno controlla l'inglese e pubblica una grammatica formale alla quale tutti sono tenuti ad aderire. L'inglese è costruito attraverso un processo esperienziale e ha contraddizioni e difetti, ma la natura probabilistica della mente umana ci consente di aggirare quelli.

Ad esempio, che questa "frase":

Questa frase non è un verbo

Tecnicamente non è affatto una frase, dal momento che non ha un verbo. Qualcuno ha avuto qualche problema a capire cosa significasse? Dubbioso. Prova a trovare una regola formale per quello. E questo è solo un esempio.

Ora, potresti elaborare una grammatica formale che copre, forse, il 90% dei casi ed è "abbastanza buona" per la maggior parte degli usi pratici? Forse, forse anche probabilmente. Ma sono abbastanza sicuro che non è possibile arrivare al 100%.


1
Il tuo esempio non è grammaticale, quindi perché una grammatica dovrebbe contenere una regola formale per descriverla?
BlindKungFuMaster,

1
Questo è esattamente il mio punto. È chiaramente inglese ed è chiaramente comprensibile, ma se non riesce a soddisfare la definizione comunemente usata di grammatica inglese. Quindi è un esempio di come l'inglese parlato nel mondo reale opera al di fuori dei limiti di una grammatica rigida.
mindcrime

2

Abbiamo concluso che si tratta di un problema circolare a due facce: la struttura non può essere dedotta senza contesto ma conoscere la struttura aiuta anche a inferire il contesto. Quindi, ecco la tua soluzione complessa: inizia con il contesto, che è determinato dalla combinazione di parole in frase (combinatoria e problema di ricerca), da lì determina la tua struttura, o "analizza" (a questo punto puoi anche filtrare alcuni parole insignificanti o almeno assegnare loro pesi inferiori), tornare al contesto, tornare all'analisi e continuare fino a quando non si arriva al significato. Pertanto, mediante la riduzione iterativa e ricorsiva, l'intero problema può essere risolto.


2

Sono fortemente in disaccordo con tutti i precedenti commenti. Non perché hanno torto, che non lo sono, ma perché sono fuorvianti, anche se involontariamente.

Ad esempio: se uno guarda questi problemi da una posizione accademica, i problemi sembreranno sempre insormontabili. Questo perché tutto viene valutato e calcolato freddamente in isolamento rispetto a tutto il resto.

La risposta sta principalmente nell'associazione di parole . Devi scrivere un programma in grado di elaborare un vasto database di libri digitali, per registrare ogni parola e tutte le parole in quella lingua che sono associate ad esso. Più tutte le informazioni statistiche con ogni parola associata e la punteggiatura associata.

Questo ti darà quindi la base su cui un'intelligenza artificiale può decidere diverse cose:

  1. Se la struttura di una determinata frase è corretta.
  2. Se la struttura è cattiva, qual è la probabilità di determinare il contesto e l'intento di ciò che viene detto.
  3. Il significato e l'applicazione corretti di una parola poliedrica (Trionfo), è per probabilità - secondo le statistiche.
  4. Per determinare dove è probabile che stia andando una conversazione.
  5. Quale dovrebbe essere la grammatica e la punteggiatura corrette.

Quindi, in conclusione, hai due cose da cercare: associazione e probabilità.

Quando si esegue il database digitale di un modello linguistico, si verifica la possibilità di "stringhe" di parole e frasi, in modo che ogni variazione della struttura linguistica in una determinata frase possa essere determinata prima, durante e dopo che un campione di testo sia stato scritto. Questo controllo intimo sui modelli del modello di linguaggio, significa che i componenti sensibili come "soggetto" e "oggetto" possono essere determinati facilmente dal codice.


Penso che sia eccessivamente ottimista. La lingua è troppo confusa perché funzioni.
Oliver Mason
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.