Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.
Ho letto questa pagina: http://neuralnetworksanddeeplearning.com/chap3.html e diceva che lo strato di output sigmoideo con entropia incrociata è abbastanza simile allo strato di output softmax con verosimiglianza logaritmica. cosa succede se utilizzo sigmoid con verosimiglianza log o softmax con entropia incrociata nel livello di output? va bene? perché vedo che c'è …
Una rete neurale apprende le caratteristiche di un set di dati come mezzo per raggiungere qualche obiettivo. Al termine, potremmo voler sapere cosa ha appreso la rete neurale. Quali erano le caratteristiche e perché gliene importava. Qualcuno può dare alcuni riferimenti sul corpo del lavoro che riguarda questo problema?
[Questa domanda è stata posta anche in caso di overflow dello stack] La domanda in breve Sto studiando reti neurali convoluzionali e credo che queste reti non trattino tutti i neuroni di input (pixel / parametri) in modo equivalente. Immagina di avere una rete profonda (molti livelli) che applica la …
Qual è la differenza tra rete neurale , rete bayesiana , albero decisionale e reti di Petri , anche se sono tutti modelli grafici e descrivono visivamente la relazione causa-effetto.
Stavo leggendo il documento ImageNet Classification con Deep Convolutional Neural Networks e nella sezione 3 dove spiegavano l'architettura della loro Convolutional Neural Network spiegavano come preferivano usare: non linearità non saturataf( x ) = m a x ( 0 , x ) .f(X)=mun'X(0,X).f(x) = max(0, x). perché era più veloce …
Perché i nodi di polarizzazione sono utilizzati nelle reti neurali? Quanti dovresti usare? In quali livelli dovresti usarli: tutti i livelli nascosti e il livello di output?
Spiegherò il mio problema con un esempio. Supponiamo di voler prevedere il reddito di un individuo in base ad alcuni attributi: {Età, Genere, Paese, Regione, Città}. Hai un set di dati di allenamento come questo train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Sto usando il cursore per eseguire una foresta casuale convalidata in modo incrociato su un set di …
Sto addestrando una semplice rete neurale sul set di dati CIFAR10. Dopo qualche tempo, la perdita di validazione ha iniziato ad aumentare, mentre aumenta anche l'accuratezza della validazione. La perdita e l'accuratezza del test continuano a migliorare. Com'è possibile? Sembra che se aumenta la perdita di validazione, l'accuratezza dovrebbe diminuire. …
Per i modelli statistici e di apprendimento automatico, esistono diversi livelli di interpretabilità: 1) l'algoritmo nel suo insieme, 2) parti dell'algoritmo in generale 3) parti dell'algoritmo su input particolari e questi tre livelli si dividono in due parti ciascuno, uno per l'allenamento e uno per la valutazione delle funzioni. Le …
Durante l'addestramento di reti neurali a segmentazione di pixel, come reti convoluzionali, come si decide di utilizzare la funzione di perdita tra entropia e la funzione di perdita a coefficiente di dadi? Mi rendo conto che questa è una domanda breve, ma non sono del tutto sicuro di quali altre …
Supponiamo di voler fare una regressione per l' f = x * yutilizzo semplice di una rete neurale profonda standardizzata. Ricordo che ci sono delle ricerche che dicono che NN con uno strato hiden può apoximare qualsiasi funzione, ma ho provato e senza normalizzazione NN non è stato in grado …
Che cos'è uno studio sull'ablazione? E c'è un modo sistematico per eseguirlo? Ad esempio, ho predittori in una regressione lineare che chiamerò come modello.nnn Come eseguirò uno studio di ablazione a questo? Quali metriche dovrei usare? Una fonte completa o un libro di testo sarebbe apprezzato.
Ho letto qui il seguente: Le uscite Sigmoid non sono centrate sullo zero . Ciò è indesiderabile poiché i neuroni nei livelli successivi di elaborazione in una rete neurale (ne parleremo presto) riceveranno dati che non sono centrati sullo zero. Ciò ha implicazioni sulla dinamica durante la discesa del gradiente, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.