R - Interpretazione del diagramma delle reti neurali


8

So che ci sono domande simili su stats.SE, ma non ne ho trovata una che soddisfi la mia richiesta; per favore, prima di contrassegnare la domanda come duplicato, ping me nel commento.

Gestisco una rete neurale basata sulla neuralnetprevisione delle serie temporali dell'indice SP500 e voglio capire come posso interpretare il diagramma pubblicato di seguito:

inserisci qui la descrizione dell'immagine

In particolare, sono interessato a capire qual è l'interpretazione del peso dello strato nascosto e del peso di input; qualcuno potrebbe spiegarmi come interpretare quel numero, per favore?

Qualsiasi suggerimento sarà apprezzato.


2
Ecco un articolo interessante che si riferisce alla tua domanda. labs.eeb.utoronto.ca/jackson/ecol.%20modelling%20ANN.pdf
MrMeritology

Grazie per il commento, @MrMeritology! L'ho trovato davvero utile!
Quantopik,

Mentre sono sicuro che sarai in grado di comprendere questa (piuttosto semplice) rete neurale, se l'interpretazione è una preoccupazione relativamente grande, probabilmente non dovresti usare una rete neurale in primo luogo. C'è un motivo specifico che hai selezionato uno rispetto ad altri algoritmi?
David,

Sì, @ David! Vorrei imparare usando questo tipo di modello. Non li ho mai usati nel mio lavoro e lo sto studiando solo per divertimento. Hai qualche idea sull'interpretazione della trama?
Quantopik,

ho bisogno di aiuto per interpretare un'analisi ANN Qualcuno che può aiutare?
kalu luminoso

Risposte:


7

Come afferma David nei commenti se si desidera interpretare un modello, è probabile che si desideri esplorare qualcosa oltre alle reti neurali. Detto questo, vuoi capire intuitivamente la trama della rete, è meglio pensarci riguardo alle immagini (qualcosa di cui le reti neurali sono molto brave).

  1. I nodi più a sinistra (ovvero i nodi di input) sono le variabili dei dati non elaborati.
  2. Le frecce in nero (e i numeri associati) sono i pesi a cui puoi pensare quanto la variabile contribuisca al nodo successivo. Le linee blu sono i pesi di polarizzazione. Puoi trovare lo scopo di questi pesi nella risposta eccellente qui .
  3. I nodi centrali (ovvero qualsiasi cosa tra i nodi di input e output) sono i tuoi nodi nascosti. Questo è dove l'analogia dell'immagine aiuta. Ognuno di questi nodi costituisce un componente che la rete sta imparando a riconoscere. Ad esempio un naso, una bocca o un occhio. Ciò non è facile da determinare ed è molto più astratto quando si ha a che fare con dati non di immagine.
  4. Il nodo di estrema destra (nodo / i di output) è l'output finale della rete neurale.

Si noti che tutto ciò sta omettendo la funzione di attivazione che verrebbe applicata anche a ciascun livello della rete.


Ottima risposta @cdeterman! molte cose sembrano essere più chiare ora. ultima cosa ... secondo te, come posso testare di nuovo la capacità del modello di prevedere l'output basandosi sul valore di input. Lasciami spiegare meglio; nel caso in cui io utilizzi un semplice modello logistico, posso usare ilβvettore e le variabili indipendenti per calcolare una previsione della variabile dipendente. Nel modello di rete neurale, come posso farlo?
Quantopik,

@Quantopic Penso che ti riferisci alla computefunzione nel neuralnetpacchetto. La fonte non è terribilmente complessa se si desidera farlo a mano. In sostanza si applicano i pesi e la funzione di attivazione su ogni strato al risultato finale.
cdeterman,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.