Ho una rete neurale impostata per prevedere qualcosa in cui la variabile di output è ordinale. Descriverò di seguito usando tre possibili uscite A <B <C.
È abbastanza ovvio come utilizzare una rete neurale per l'output di dati categorici: l'output è solo un softmax dell'ultimo livello (generalmente completamente collegato), uno per categoria, e la categoria prevista è quella con il valore di output più grande (questo è impostazione predefinita in molti modelli popolari). Ho usato la stessa configurazione per i valori ordinali. Tuttavia, in questo caso le uscite spesso non hanno senso, ad esempio le uscite di rete per A e C sono alte ma B è bassa: questo non è plausibile per i valori ordinali.
Ho un'idea per questo, che è quella di calcolare la perdita sulla base del confronto delle uscite con 1 0 0 per A, 1 1 0 per B e 1 1 1 per C. Le soglie esatte possono essere sintonizzate successivamente utilizzando un altro classificatore (ad es. Bayesiano ) ma ciò sembra catturare l'idea essenziale di un ordinamento di input, senza prescrivere una scala di intervallo specifica.
Qual è il modo standard di risolvere questo problema? Esistono ricerche o riferimenti che descrivono i pro ei contro di diversi approcci?