Supponiamo di voler fare una classificazione binaria (qualcosa appartiene alla classe A o alla classe B). Esistono alcune possibilità per farlo nel livello di output di una rete neurale:
Usa 1 nodo di output. L'uscita 0 (<0,5) è considerata in classe A e 1 (> = 0,5) è considerata in classe B (in caso di sigmoide)
Utilizzare 2 nodi di output. L'input appartiene alla classe del nodo con il valore / probabilità più alto (argmax).
Ci sono documenti scritti che (anche) discutono di questo? Quali sono le parole chiave specifiche su cui cercare?
Questa domanda è già stata posta in precedenza su questo sito, ad es. Vedere questo link senza risposte reali. Ho bisogno di fare una scelta (tesi di laurea), quindi voglio ottenere informazioni sui pro / contro / limiti di ogni soluzione.