Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.
Supponiamo di voler fare una classificazione binaria (qualcosa appartiene alla classe A o alla classe B). Esistono alcune possibilità per farlo nel livello di output di una rete neurale: Usa 1 nodo di output. L'uscita 0 (<0,5) è considerata in classe A e 1 (> = 0,5) è considerata in …
La mia perdita di allenamento diminuisce e poi aumenta di nuovo. È molto strano. La perdita di convalida incrociata tiene traccia della perdita di addestramento. Cosa sta succedendo? Ho due LSTMS in pila come segue (su Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) …
Sono interessato alla regressione con le reti neurali. Le reti neurali con zero nodi nascosti + connessioni skip-layer sono modelli lineari. Che dire delle stesse reti neurali ma con nodi nascosti? Mi chiedo quale sarebbe il ruolo delle connessioni skip-layer? Intuitivamente, direi che se includi le connessioni skip-layer, il modello …
Mi chiedevo, perché è così importante avere l'apprendimento automatico di principio / teorico? Da una prospettiva personale come essere umano, posso capire perché l'apprendimento automatico basato sui principi sarebbe importante: agli umani piace capire cosa stanno facendo, troviamo bellezza e soddisfazione per la comprensione. dal punto di vista della teoria, …
Voglio usare il deep learning nel mio progetto. Ho esaminato un paio di articoli e mi è venuta una domanda: c'è qualche differenza tra la rete neurale di convoluzione e l'apprendimento profondo? Queste cose sono uguali o presentano differenze sostanziali e quale è meglio?
Questa domanda è stata migrata dallo Stack Overflow perché è possibile rispondere su Convalida incrociata. Migrato 7 anni fa . Sto cercando di imparare come funziona Neural Network sul riconoscimento delle immagini. Ho visto alcuni esempi e sono diventato ancora più confuso. Nell'esempio del riconoscimento di lettere di un'immagine 20x20, …
Data una funzione di costo convesso, usando SGD per l'ottimizzazione, avremo un gradiente (vettore) ad un certo punto durante il processo di ottimizzazione. La mia domanda è, dato il punto sul convesso, il gradiente punta solo nella direzione in cui la funzione aumenta / diminuisce più velocemente, oppure il gradiente …
Chiuso . Questa domanda è basata sull'opinione . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che possa essere risolta con fatti e citazioni modificando questo post . Chiuso 2 anni fa . Problema fondamentale con l'apprendimento profondo e le reti neurali in generale. …
Quali sono i vantaggi, perché si dovrebbero usare più LSTM, accatastati uno accanto all'altro, in una rete profonda? Sto usando un LSTM per rappresentare una sequenza di input come un singolo input. Quindi una volta che ho quella singola rappresentazione, perché dovrei passarla di nuovo? Lo sto chiedendo perché l'ho …
Perché le funzioni di attivazione delle unità lineari rettificate (ReLU) sono considerate non lineari? f( x ) = max ( 0 , x )f(x)=max(0,x) f(x) = \max(0,x) Sono lineari quando l'input è positivo e dalla mia comprensione per sbloccare il potere rappresentativo delle reti profonde, le attivazioni non lineari sono …
Stavo leggendo dell'ottimizzatore Adam per Deep Learning e mi sono imbattuto nella frase seguente nel nuovo libro Deep Learning di Bengio, Goodfellow e Courville: Adam è generalmente considerato abbastanza robusto per la scelta dei parametri iper, sebbene il tasso di apprendimento a volte debba essere modificato rispetto al valore predefinito …
So che la mia domanda / titolo non è molto specifica, quindi cercherò di chiarirla: Le reti neurali artificiali hanno progetti relativamente rigidi. Naturalmente, generalmente, sono influenzati dalla biologia e cercano di costruire un modello matematico di reti neurali reali, ma la nostra comprensione delle reti neurali reali non è …
Ho 50.000 immagini come queste due: Rappresentano grafici di dati. Volevo estrarre funzionalità da queste immagini, quindi ho usato il codice di autoencoder fornito da Theano (deeplearning.net). Il problema è che questi codificatori automatici non sembrano apprendere alcuna funzionalità. Ho provato RBM ed è lo stesso. Il set di dati …
In Alex Krizhevsky, et al. La classificazione di Imagenet con reti neurali profonde convoluzionali enumera il numero di neuroni in ogni strato (vedi diagramma sotto). L'input della rete è di 150.528 dimensioni e il numero di neuroni negli strati rimanenti della rete è dato da 253.440–186.624–64.896–64.896–43.264– 4096–4096–1000. Una vista 3D …
Qual è la differenza tra dropout e drop connect? AFAIK, il dropout rilascia casualmente nodi nascosti durante l'allenamento ma li mantiene in fase di test e drop connect rilascia connessioni. Ma eliminare le connessioni equivale a eliminare i nodi nascosti? I nodi (o le connessioni) non sono solo un insieme …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.