Ho un elenco di parole, appartenenti a diverse categorie autodefinite. Ogni categoria ha il suo modello (ad esempio uno ha una lunghezza fissa con caratteri speciali, un'altra esiste di caratteri che si verificano solo in questa categoria di "parola", ...).
Per esempio:
"ABC" -> type1
"ACC" -> type1
"a8 219" -> type2
"c 827" -> type2
"ASDF 123" -> type2
"123123" -> type3
...
Sto cercando una tecnica di apprendimento automatico per apprendere questi schemi da solo, sulla base dei dati di allenamento. Ho già provato a definire alcune variabili predittive (ad esempio lunghezza delle parole, numero di caratteri speciali, ...) da solo e quindi ho usato una rete neurale per apprendere e prevedere la categoria. Ma non è quello che voglio. Voglio una tecnica per imparare il modello per ogni categoria da solo - anche per imparare modelli a cui non ho mai pensato.
Quindi fornisco i dati di apprendimento dell'algoritmo (costituiti dagli esempi di categorie di parole) e voglio che apprenda schemi per ciascuna categoria per prevedere in seguito la categoria da parole simili o uguali.
Esiste un modo all'avanguardia per farlo?
Grazie per l'aiuto