Una rete neurale è una scatola nera nel senso che mentre può approssimare qualsiasi funzione, studiare la sua struttura non ti darà alcuna idea sulla struttura della funzione che si sta approssimando.
Ad esempio, un uso comune delle reti neurali nel settore bancario è quello di classificare i mutuatari su "buoni pagatori" e "cattivi pagatori". Hai una matrice di caratteristiche di input (sesso, età, reddito, ecc.) E un vettore di risultati ("predefinito", "non predefinito", ecc.). Quando si modella questo usando una rete neurale, si suppone che esista una funzione , nel senso proprio di una funzione matematica. Questa funzione f può essere arbitrariamente complessa e potrebbe cambiare in base all'evoluzione del business, quindi non è possibile derivarla manualmente.CRf( C) = R
Quindi si utilizza la rete neurale per creare un'approssimazione di con un tasso di errore accettabile per l'applicazione. Funziona e la precisione può essere arbitrariamente piccola: puoi espandere la rete, perfezionare i parametri di allenamento e ottenere più dati fino a quando la precisione non raggiunge i tuoi obiettivi.f
Il problema della scatola nera è: l'approssimazione data dalla rete neurale non ti darà alcuna idea sulla forma di f. Non esiste un semplice collegamento tra i pesi e la funzione che si sta approssimando. Anche l'analisi di quale caratteristica di input è irrilevante è un problema aperto (vedi questo link ).
Inoltre, dal punto di vista statistico tradizionale, una rete neurale è un modello non identificabile: dato un set di dati e una topologia di rete, possono esserci due reti neurali con pesi diversi e lo stesso risultato. Questo rende l'analisi molto difficile.
Come esempio di "modelli di scatole non nere" o "modelli interpretabili", sono presenti equazioni di regressione e alberi delle decisioni. Il primo fornisce un'approssimazione in forma chiusa di f in cui l'importanza di ciascun elemento è esplicita, il secondo è una descrizione grafica di alcuni rischi / rapporti di probabilità relativi.