Domande taggate «neural-networks»

Le reti neurali artificiali (ANN) sono un'ampia classe di modelli computazionali vagamente basati su reti neurali biologiche. Comprendono NN feedforward (inclusi NN "profondi"), NN convoluzionali, NN ricorrenti, ecc.



2
Come può una rete neurale artificiale ANN essere utilizzata per il clustering senza supervisione?
Capisco come un artificial neural network (ANN), può essere addestrato in modo supervisionato usando backpropogation per migliorare l'adattamento diminuendo l'errore nelle previsioni. Ho sentito che un ANN può essere utilizzato per l'apprendimento senza supervisione, ma come può essere fatto senza una funzione di costo di qualche tipo per guidare le …





6
Quali sono le alternative di Discesa gradiente?
La Discesa a Gradiente ha il problema di rimanere bloccati nei Minimi Locali. Dobbiamo eseguire tempi esponenziali di discesa gradiente per trovare minimi globali. Qualcuno può parlarmi di qualsiasi alternativa alla discesa gradiente applicata nell'apprendimento della rete neurale, insieme ai suoi pro e contro.

2
Perché le reti neurali convoluzionali non usano una macchina vettoriale di supporto per classificare?
Negli ultimi anni, le reti neurali convoluzionali (CNN) sono diventate lo stato dell'arte per il riconoscimento degli oggetti nella visione artificiale. In genere, una CNN è composta da diversi livelli convoluzionali, seguiti da due livelli completamente collegati. Un'intuizione alla base di ciò è che i livelli convoluzionali apprendono una migliore …




4
Come vengono applicati i kernel alle mappe caratteristiche per produrre altre mappe caratteristiche?
Sto cercando di comprendere la parte di convoluzione delle reti neurali convoluzionali. Guardando la figura seguente: Non ho problemi a comprendere il primo livello di convoluzione in cui abbiamo 4 kernel diversi (di dimensioni ), che contiamo con l'immagine di input per ottenere 4 mappe caratteristiche.k×kk×kk \times k Quello che …

4
Quale funzione di attivazione per il livello di output?
Mentre la scelta delle funzioni di attivazione per il livello nascosto è abbastanza chiara (principalmente sigma o tanh), mi chiedo come decidere la funzione di attivazione per il livello di output. Le scelte comuni sono funzioni lineari, funzioni sigmoidi e funzioni softmax. Tuttavia, quando dovrei usare quale?


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.