Durante la lettura della generazione di testo con le reti neurali ricorrenti ho notato che alcuni esempi sono stati implementati per generare testo parola per parola e altri carattere per carattere senza dichiarare effettivamente il perché.
Quindi, qual è la differenza tra i modelli RNN che prevedono la base del testo per parola e quelli che prevedono la base del testo per carattere ? RNN basato su parole richiede una dimensione del corpus maggiore? Le RNN basate sui caratteri si generalizzano meglio? Forse l'unica differenza è la rappresentazione in input (codifica one-hot, incorporamenti di parole)? Quali scegliere per la generazione di testo?