Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.
Sto cercando di comprendere diverse architetture di reti neurali ricorrenti (RNN) da applicare ai dati delle serie temporali e mi sto confondendo un po 'con i diversi nomi che vengono frequentemente utilizzati nella descrizione di RNN. La struttura della memoria a breve termine (LSTM) e della Gated Recurrent Unit (GRU) …
Nell'addestramento di reti neurali profonde e superficiali, perché sono comunemente usati i metodi a gradiente (ad es. Discesa a gradiente, Nesterov, Newton-Raphson) rispetto ad altre metaeuristiche? Per metaeuristica intendo metodi come ricottura simulata, ottimizzazione delle colonie di formiche, ecc., Che sono stati sviluppati per evitare di rimanere bloccati in un …
Ho usato theano per sperimentare LSTM e mi chiedevo quali metodi di ottimizzazione (SGD, Adagrad, Adadelta, RMSprop, Adam, ecc.) Funzionino meglio per gli LSTM? Ci sono articoli di ricerca su questo argomento? Inoltre, la risposta dipende dal tipo di applicazione per cui sto usando LSTM? In tal caso, sto usando …
Perché la backpropagation non funziona quando si inizializza tutto il peso con lo stesso valore (diciamo 0,5), ma funziona bene quando si danno numeri casuali? L'algoritmo non dovrebbe calcolare l'errore e funzionare da lì, nonostante il fatto che inizialmente i pesi siano gli stessi?
In termini di gergo della rete neurale (y = Peso * x + bias) come faccio a sapere quali variabili sono più importanti di altre? Ho una rete neurale con 10 input, 1 layer nascosto con 20 nodi e 1 layer di output con 1 nodo. Non sono sicuro di …
Sto lavorando alla classificazione della fase del sonno. Ho letto alcuni articoli di ricerca su questo argomento, molti dei quali hanno utilizzato il metodo SVM o ensemble. È una buona idea utilizzare una rete neurale convoluzionale per classificare il segnale EEG monodimensionale? Sono nuovo di questo tipo di lavoro. Mi …
Ho un problema molto semplice ma non riesco a trovare lo strumento giusto per risolverlo. Ho una sequenza di vettori della stessa lunghezza. Ora vorrei addestrare LSTM RNN sul treno campione di queste sequenze e poi farlo predire una nuova sequenza di vettori di lunghezza basata su diversi vettori di …
Sono curioso di sapere quanto sia importante il nodo di polarizzazione per l'efficacia delle moderne reti neurali. Posso facilmente capire che può essere importante in una rete poco profonda con solo poche variabili di input. Tuttavia, le moderne reti neurali come l'apprendimento profondo spesso hanno un gran numero di variabili …
RNN può essere utilizzato per la previsione o il mapping da sequenza a sequenza. Ma come si può usare RNN per la classificazione? Voglio dire, diamo un'intera sequenza un'etichetta.
Comprendo i livelli convoluzionali e di raggruppamento, ma non riesco a vedere il motivo di un livello completamente connesso nelle CNN. Perché il livello precedente non è collegato direttamente al livello di output?
Per utilizzare SVM o la rete neurale è necessario trasformare (codificare) le variabili categoriali in variabili numeriche, il metodo normale in questo caso è utilizzare 0-1 valori binari con il k-esimo valore categoriale trasformato in (0,0, .. ., 1,0, ... 0) (1 è sulla posizione k-esima). Esistono altri metodi per …
Sento spesso persone che parlano delle reti neurali come qualcosa di simile a una scatola nera che non capisci cosa fa o cosa significano. In realtà non riesco a capire cosa intendano con questo! Se capisci come funziona la retro-propagazione, allora come è una scatola nera? Significa che non capiamo …
Ho avuto una leggera confusione sull'algoritmo di backpropagation utilizzato nel perceptron multistrato (MLP). L'errore viene corretto dalla funzione di costo. In backpropagation, stiamo cercando di regolare il peso degli strati nascosti. L'errore di output che posso capire, vale a dire, e = d - y[senza gli abbonati]. Le domande sono: …
Lavorando sul problema della regressione, ho iniziato a pensare alla rappresentazione della funzione "giorno della settimana". Mi chiedo quale approccio avrebbe prestazioni migliori: una caratteristica; valore 1/7 per lunedì; 2/7 per martedì ... 7 caratteristiche: (1, 0, 0, 0, 0, 0, 0) per lunedì; (0, 1, 0, 0, 0, 0, …
La domanda potrebbe sembrare un po 'strana perché sono nuovo nell'inferenza statistica e nelle reti neurali. Quando in problemi di classificazione usando le reti neurali diciamo che vogliamo imparare una funzione f∗f∗f^* che mappa lo spazio degli ingressi xxx , allo spazio delle uscite yyy : f∗(x;θ)=yf∗(x;θ)=yf^*(x; \theta) = y …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.