Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.
Supponiamo che io abbia una semplice rete neurale a singolo strato, con n input e un singolo output (compito di classificazione binaria). Se imposto la funzione di attivazione nel nodo di output come funzione sigmoide, il risultato è un classificatore di regressione logistica. In questo stesso scenario, se cambio l'attivazione …
I problemi di classificazione con confini non lineari non possono essere risolti da un semplice percettrone . Il seguente codice R è a scopo illustrativo e si basa su questo esempio in Python): nonlin <- function(x, deriv = F) { if (deriv) x*(1-x) else 1/(1+exp(-x)) } X <- matrix(c(-3,1, -2,1, …
Sto esaminando la funzione di costo dell'entropia incrociata che si trova in questo tutorial : C=−1n∑x[ylna+(1−y)ln(1−a)]C=−1n∑x[ylna+(1−y)ln(1−a)]C = -\frac{1}{n} \sum_x [y \ln a+(1−y)\ln(1−a)] Cosa stiamo esattamente riassumendo? E ', ovviamente, su , ma e non cambiano con . Tutte le sono input in quello . è persino definito nel paragrafo sopra …
Comprendo che il pretrattamento viene utilizzato per evitare alcuni dei problemi con la formazione convenzionale. Se uso la backpropagation con, diciamo un codificatore automatico, so che mi imbatterò in problemi di tempo perché la backpropagation è lenta, e anche che posso rimanere bloccato in optima locale e non apprendere alcune …
Nell'attività di visione artificiale, come la classificazione degli oggetti, con Convolutional Neural Networks (CNN), la rete offre prestazioni interessanti. Ma non sono sicuro di come impostare i parametri in strati convoluzionali. Ad esempio, un'immagine in scala di grigi ( 480x480), il primo livello convoluzionale può usare un operatore convoluzionale come …
Ho sentito parlare dell'uso delle reti neurali per prevedere le serie temporali. Come posso confrontare, quale metodo per prevedere le mie serie temporali (dati al dettaglio giornalieri) è migliore: auto.arima (x), ets (x) o nnetar (x). Posso confrontare auto.arima con ets di AIC o BIC. Ma come posso confrontarli con …
Sono nuovo nell'analisi di sopravvivenza e ho recentemente appreso che ci sono diversi modi per farlo dato un determinato obiettivo. Sono interessato all'attuazione effettiva e all'adeguatezza di questi metodi. Mi sono stati presentati i tradizionali modelli di rischio proporzionale di Cox , modelli temporali di fallimento accelerato e reti neurali …
Sono arrivato a una situazione in cui i pesi della mia rete neurale non convergono anche dopo 500 iterazioni. La mia rete neurale contiene 1 livello di input, 1 livello nascosto e 1 livello di output. Sono circa 230 nodi nel livello di input, 9 nodi nel livello nascosto e …
Sia la funzione logistica che la deviazione standard sono generalmente indicate con . Userò e per la deviazione standard.σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp(−x))\sigma(x) = 1/(1+\exp(-x))sss Ho un neurone logistica con un ingresso casuale la cui media e deviazione standard lo so. Spero che la differenza dalla media possa essere approssimata bene da un certo …
Nei lavori di DeepMind AlphaGo Zero e AlphaZero , descrivono l'aggiunta del rumore Dirichlet alle precedenti probabilità di azioni dal nodo radice (stato della scheda) in Monte Carlo Tree Search: Ulteriore esplorazione si ottiene aggiungendo il rumore di Dirichlet alle probabilità precedenti nel nodo radice , in particolare P ( …
Nel documento chiamato Deep Learning e il principio del collo di bottiglia delle informazioni gli autori dichiarano nella sezione II A) quanto segue: I singoli neuroni classificano solo input separabili linearmente, poiché possono implementare solo iperpiani nel loro spazio di input . Gli iperpiani possono classificare in modo ottimale i …
Nel recente documento WaveNet , gli autori fanno riferimento al loro modello come se avessero strati sovrapposti di convoluzioni dilatate. Producono anche i seguenti grafici, che spiegano la differenza tra convoluzioni 'regolari' e convoluzioni dilatate. Le convoluzioni regolari sembrano Questa è una convoluzione con una dimensione del filtro di 2 …
Ho letto di SVM e ho appreso che stanno risolvendo un problema di ottimizzazione e l'idea del margine massimo era molto ragionevole. Ora, usando i kernel, riescono a trovare anche i confini di separazione non lineari, il che era grandioso. Finora, non ho davvero idea di come SVM (una macchina …
Uso RNN bidirezionale per rilevare un evento di evento sbilanciato. La classe positiva è 100 volte meno spesso della classe negativa. Sebbene non sia possibile utilizzare la regolarizzazione, posso ottenere una precisione del 100% sul set di treni e del 30% sul set di convalida. Attivo la regolarizzazione l2 e …
Sto cercando di capire l'architettura degli RNN. Ho trovato questo tutorial molto utile: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ Soprattutto questa immagine: Come si inserisce in una rete feed-forward? Questa immagine è solo un altro nodo in ogni livello?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.