Vorrei utilizzare dati non atomici, come funzionalità per una previsione. Supponiamo che io abbia una tabella con queste caratteristiche:
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
Vorrei prevedere / classificare, ad esempio, la colonna 2.
Sto facendo qualcosa per rispondere automaticamente alle domande, qualsiasi tipo di domanda, come "Dov'è nato Foo?" ...
Prima eseguo una query su un motore di ricerca, quindi ottengo alcuni dati di testo come risultato, quindi eseguo tutte le analisi (tagging, stemming, analisi, suddivisione ...)
Il mio primo approccio è stato quello di creare una tabella, ogni riga con una riga di testo e molte funzionalità, come "First Word", "Tag of First Word", "Chunks", ecc ...
Ma con questo approccio mi mancano le relazioni tra le frasi.
Vorrei sapere se esiste un algoritmo che guarda all'interno delle strutture (o dei vettori) dell'albero e rende le relazioni ed estrae tutto ciò che è rilevante per la previsione / classificazione. Preferirei conoscere una libreria che lo fa piuttosto che un algoritmo che devo implementare.