Sto costruendo una rete neurale per prevedere il valore di un'opera d'arte con una vasta gamma di input (dimensioni, supporto artistico, ecc.) E vorrei includere anche l'autore come input (spesso è un enorme fattore nel valore di un singolo pezzo d'arte).
La mia attuale preoccupazione è che il nome dell'autore non sia un input numerico ideale per un NN (cioè se codifico ogni autore con un valore intero crescente, assegnerò indirettamente più valore agli autori più in basso nell'elenco -_-) . Il mio pensiero era quello di creare input separati per tutti gli autori nel mio set di dati e quindi utilizzare solo una codifica a caldo per rappresentare meglio l'input per NN.
Questo approccio tuttavia presenta un problema quando un autore che non è incluso nei miei dati di addestramento viene utilizzato come input per la NN (ovvero un nuovo autore). Posso aggirare questo problema con un campo di input "altro autore" ma sono preoccupato che ciò non sia accurato in quanto non avrei addestrato la NN per questo input (tutte le opere d'arte con una valutazione hanno un autore).
Non ci ho pensato fino in fondo, ma forse ho pensato di formare 2 NN, uno per una valutazione senza un autore e uno per la valutazione con un autore per assicurarmi di avere abbastanza dati di formazione per una "valutazione senza autore" per essere ancora ragionevolmente accurati.
Sto ancora cercando di concettualizzare la migliore architettura NN prima di rimanere bloccato nell'implementazione, quindi se qualcuno ha qualche suggerimento / commento sarei molto grato!
Grazie in anticipo, Vince
PS Lo sto facendo come una piccola competizione con un amico per testare una NN rispetto alle tradizionali tecniche di valutazione commerciale. Ti prego, aiutami a ottenere una vittoria per l'Informatica rispetto alla Scienza attuariale.