Quindi, sto appena iniziando a imparare come una rete neurale può operare per riconoscere schemi e classificare input, e ho visto come una rete neurale artificiale può analizzare i dati delle immagini e classificare le immagini ( demo con convnetjs ), e la chiave lì consiste nel sottocampionare l'immagine e ogni pixel stimola un neurone di input nella rete.
Tuttavia, sto cercando di avvolgere la testa se è possibile farlo con input di stringa? Il caso d'uso che ho è un "motore di raccomandazione" per i film che un utente ha visto. I film contengono molti dati sulle stringhe (titolo, trama, tag) e potrei immaginare di "sottocampionare" il testo in poche parole chiave che descrivono quel film, ma anche se analizzo le prime cinque parole che descrivono questo film, io pensi che avrei bisogno di neuroni di input per ogni parola inglese per confrontare un set di film? Potrei limitare i neuroni di input solo alle parole usate nel set, ma poi potrebbe crescere / imparare aggiungendo nuovi film (l'utente guarda un nuovo film, con nuove parole)? La maggior parte delle librerie che ho visto non consente l'aggiunta di nuovi neuroni dopo che il sistema è stato addestrato?
Esiste un modo standard per mappare i dati stringa / parola / carattere agli input in una rete neurale? Oppure una rete neurale non è davvero lo strumento giusto per il lavoro di analisi dei dati di stringa come questo (qual è lo strumento migliore per la corrispondenza dei modelli nei dati di stringa)?