Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.
Stavo esaminando i documenti di convoluzione di keras e ho trovato due tipi di convulsioni Conv1D e Conv2D. Ho fatto qualche ricerca sul web e questo è ciò che capisco di Conv1D e Conv2D; Conv1D viene utilizzato per le sequenze e Conv2D utilizza per le immagini. Ho sempre pensato che …
I miei professori di fisica alla scuola elementare, così come il premio Nobel Feynman, presentavano sempre quelli che chiamavano modelli di giocattoli per illustrare concetti e metodi di base in fisica, come l'oscillatore armonico, il pendolo, la trottola e la scatola nera. Quali modelli di giocattoli vengono utilizzati per illustrare …
Sto cercando di capire il significato matematico dei modelli di classificazione non lineari: Ho appena letto un articolo che parla delle reti neurali come modello di classificazione non lineare. Ma mi rendo conto che: Il primo strato: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2} h2= x1∗ wx 2 h 1+ x2∗ wx 2 h 2h2=x1∗wx2h1+x2∗wx2h2h_2=x_1∗w_{x2h1}+x_2∗w_{x2h2} Il …
Molti tutorial online parlano della discesa del gradiente e quasi tutti usano un passo fisso (tasso di apprendimento ). Perché la ricerca della linea non viene utilizzata (come la ricerca della riga di backtracking o la ricerca della riga esatta)?αα\alpha
Ho visto conclusioni simili da molte discussioni, che con l'aumentare delle dimensioni del minibatch la convergenza di SGD diventa effettivamente più difficile / peggio, ad esempio questo documento e questa risposta . Ho anche sentito parlare di persone che usano trucchi come piccoli tassi di apprendimento o dimensioni dei lotti …
Definiamo un'epoca come aver esaminato tutti i campioni di addestramento disponibili e le dimensioni del mini-lotto come il numero di campioni su cui calcoliamo la media per trovare gli aggiornamenti ai pesi / errori necessari per scendere il gradiente. La mia domanda è se dovremmo trarre senza sostituzione dall'insieme degli …
Di seguito sono riportati i 6 limiti di decisione. I confini delle decisioni sono linee violette. Punti e croci sono due diversi set di dati. Dobbiamo decidere quale è un: SVM lineare SVM Kernelized (kernel polinomiale di ordine 2) Perceptron Regressione logistica Rete neurale (1 strato nascosto con 10 unità …
Sono nuovo di Recurrent Neural Networks (RNN) e sto ancora imparando i concetti. Comprendo a livello astratto che una Echo State Network (ESN) è in grado di (ri) produrre una sequenza di ingressi, cioè un segnale, anche dopo che l'ingresso è stato rimosso. Tuttavia, ho trovato l' articolo di Scholarpedia …
Sto cercando di identificare il modello migliore per prevedere i prezzi delle automobili, utilizzando i prezzi e le funzionalità disponibili sui siti di annunci classificati automobilistici. Per questo ho usato un paio di modelli della libreria scikit-learn e modelli di reti neurali di pybrain e neurolab. L'approccio che ho usato …
Nel libro di Bishop "Classificazione dei modelli e apprendimento automatico", descrive una tecnica per la regolarizzazione nel contesto delle reti neurali. Tuttavia, non capisco un paragrafo che descriva che durante il processo di formazione, il numero di gradi di libertà aumenta insieme alla complessità del modello. La citazione pertinente è …
Mi sono tuffato nel campo delle reti neurali e ne sono rimasto affascinato. Ho finalmente sviluppato un framework applicativo per testare i sistemi commerciali nelle borse e ora implementerò la mia prima rete neurale. Uno molto semplice e primitivo, non destinato al trading reale, ma solo per i principianti. Voglio …
Sto esaminando il seguente blog sulla rete neurale LSTM: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ L'autore rimodella il vettore di input X come [campioni, intervalli di tempo, funzionalità] per diverse configurazioni di LSTM. L'autore scrive In effetti, le sequenze di lettere sono fasi temporali di una funzione anziché una fase temporale di funzioni separate. Abbiamo …
Di recente, ho studiato autoencoders. Se ho capito bene, un codificatore automatico è una rete neurale in cui il livello di input è identico al livello di output. Pertanto, la rete neurale tenta di prevedere l'output utilizzando l'input come standard aureo. Qual è l'utilità di questo modello? Quali sono i …
Ho un paio di domande che mi confondono riguardo alla CNN. 1) Le funzionalità estratte utilizzando CNN sono invarianti di scala e rotazione? 2) I kernel che utilizziamo per la convoluzione con i nostri dati sono già definiti in letteratura? che tipo di questi kernel sono? è diverso per ogni …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.