Questi termini vengono spesso messi insieme, ma vorrei sapere quali pensi siano le differenze, se ce ne sono.
Grazie
Questi termini vengono spesso messi insieme, ma vorrei sapere quali pensi siano le differenze, se ce ne sono.
Grazie
Risposte:
LSA e LSI sono utilizzate principalmente come sinonimi, con la comunità di recupero delle informazioni che di solito si riferisce ad essa come LSI. LSA / LSI utilizza SVD per scomporre la matrice del termine-documento A in una matrice del concetto-termine U, una matrice di valore singolare S e una matrice del documento-concetto V nella forma: A = USV '. La pagina di Wikipedia ha una descrizione dettagliata dell'indicizzazione semantica latente .
In particolare, mentre LSA e LSI usano SVD per fare la loro magia, esiste un metodo computazionalmente e concettualmente più semplice chiamato HAL (Hyperspace Analogue to Language) che scorre attraverso il testo tenendo traccia dei contesti precedenti e successivi. I vettori vengono estratti da queste matrici di ricorrenza (spesso ponderate) e vengono selezionate parole specifiche per indicizzare lo spazio semantico. In molti modi mi viene dato di capire che funziona così come LSA senza richiedere il passaggio matematicamente / concettualmente complesso di SVD. Vedi Lund & Burgess, 1996 per i dettagli.
NMF e SVD sono entrambi algoritmi di fattorizzazione a matrice. Wikipedia ha alcune informazioni rilevanti su NMF .
Gli altri soccorritori hanno coperto LSI / LSA ...