Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.
Nella letteratura della rete neurale, spesso incontriamo la parola "tensore". È diverso da un vettore? E da una matrice? Hai qualche esempio specifico che chiarisce la sua definizione? Sono un po 'confuso riguardo alla sua definizione. Wikipedia non aiuta e talvolta ho l'impressione che la sua definizione dipenda dallo specifico …
Sto cercando di capire il contesto del famoso libro di Minsky e Papert "Perceptrons" del 1969, fondamentale per le reti neurali. Per quanto ne so, non c'erano ancora altri algoritmi di apprendimento supervisionato generico ad eccezione di perceptron: gli alberi decisionali hanno iniziato a diventare effettivamente utili solo alla fine …
Mi scuso in anticipo per il fatto che sto ancora arrivando al passo con questo. Sto cercando di capire i pro e i contro dell'utilizzo di tanh (mappa da -1 a 1) vs. sigmoid (mappa da 0 a 1) per la mia funzione di attivazione del neurone. Dalla mia lettura …
Quando apprendo la rete neurale convoluzionale, ho domande riguardanti la figura seguente. 1) C1 nel layer 1 ha 6 mappe caratteristiche, significa che ci sono sei kernel convoluzionali? Ogni kernel convoluzionale viene utilizzato per generare una mappa delle caratteristiche basata sull'input. 2) S1 nel livello 2 ha 6 mappe caratteristiche, …
Sto studiando reti neurali convoluzionali (CNN) a causa delle loro applicazioni nella visione artificiale. Ho già familiarità con le reti neurali standard feed-foward, quindi spero che alcune persone qui possano aiutarmi a fare un passo in più nella comprensione delle CNN. Ecco cosa penso delle CNN: Nei tradizionali NN feed-foward, …
Mi sono imbattuto in alcuni modi di base per misurare la complessità delle reti neurali: Ingenuo e informale: conta il numero di neuroni, neuroni nascosti, strati o strati nascosti Dimensione VC (Eduardo D. Sontag [1998] "Dimensione VC delle reti neurali" [ pdf ].) Una complessità computazionaleTC0dTCd0TC^0_d granulare e asintotica misura …
Ho bisogno di alcune risorse per iniziare a utilizzare le reti neurali per la previsione delle serie storiche. Sono diffidente nell'implementare alcuni documenti e poi scoprire che hanno ampiamente dichiarato il potenziale dei loro metodi. Quindi, se hai esperienza con i metodi che stai suggerendo, sarà ancora più fantastico.
Questa è una questione di terminologia. A volte vedo che le persone si riferiscono a reti neurali profonde come "percetroni multistrato", perché? Un percettrone, mi hanno insegnato, è un classificatore a singolo strato (o regressore) con un'uscita di soglia binaria che utilizza un modo specifico di allenamento dei pesi (non …
Sto addestrando una rete neurale usando i) SGD e ii) Adam Optimizer. Quando utilizzo SGD normale, ottengo una perdita di allenamento regolare rispetto alla curva di iterazione come mostrato di seguito (quella rossa). Tuttavia, quando ho usato Adam Optimizer, la curva di perdita dell'allenamento presenta alcuni picchi. Qual è la …
Comprendo il ragionamento alla base della suddivisione dei dati in un set di test e un set di convalida. Comprendo anche che la dimensione della divisione dipenderà dalla situazione, ma generalmente varierà dal 50/50 al 90/10. Ho creato un RNN per correggere l'ortografia e iniziare con un set di dati …
Durante l'addestramento di un semplice classificatore binario di una rete neurale ottengo un alto valore di perdita, usando l'entropia incrociata. Nonostante ciò, il valore dell'accuratezza sul set di validazione è abbastanza buono. Ha qualche significato? Non esiste una stretta correlazione tra perdita e precisione? Ho sulla formazione e la convalida …
Sto sperimentando l'algoritmo della macchina per aumentare il gradiente tramite il caretpacchetto in R. Utilizzando un piccolo set di dati di ammissione al college, ho eseguito il seguente codice: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
Sto esaminando l'utilizzo di una versione LSTM ( memoria a breve termine ) di una rete neurale ricorrente (RNN) per la modellazione dei dati di serie temporali. All'aumentare della lunghezza della sequenza dei dati, aumenta la complessità della rete. Sono quindi curioso di sapere quale lunghezza delle sequenze sarebbe possibile …
Ho creato alcune reti neurali (MLP (completamente connesse), Elman (ricorrenti)) per diversi compiti, come giocare a Pong, classificare cifre scritte a mano e cose ... Inoltre ho cercato di costruire alcune prime reti neurali convoluzionali, ad esempio per classificare note scritte a mano a più cifre, ma sono completamente nuovo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.