TLDR:
la rete neurale convoluzionale è una sottoclasse di reti neurali che hanno almeno uno strato di convoluzione. Sono ideali per acquisire informazioni locali (ad es. Pixel vicini in un'immagine o parole circostanti in un testo) e per ridurre la complessità del modello (formazione più rapida, necessità di un numero inferiore di campioni, riduzione delle possibilità di adattamento eccessivo).
Vedere il seguente grafico che illustra le varie architetture reti neurali tra cui profonda convenzionali-reti neurali: .
Reti neurali (NN) , o più precisamente reti neurali artificiali (ANN) , è una classe di algoritmi di Machine Learning che recentemente hanno ricevuto molta attenzione (di nuovo!) A causa della disponibilità di Big Data e di strutture di elaborazione veloce (la maggior parte di Deep Learning gli algoritmi sono essenzialmente diverse varianti di ANN).
La classe di ANN copre diverse architetture tra cui Convolutional Neural Networks ( CNN ), Recurrent Neural Networks ( RNN ), ad esempio LSTM e GRU , Autoencoder e Deep Belief Networks . Pertanto, la CNN è solo un tipo di ANN.
In generale, un ANN è una raccolta di unità connesse e sintonizzabili (alias nodi, neuroni e neuroni artificiali) che possono passare un segnale (di solito un valore reale) da un'unità a un'altra. Il numero di (strati di) unità, i loro tipi e il modo in cui sono collegati tra loro è chiamato architettura di rete.
Una CNN, in particolare, ha uno o più strati di unità di convoluzione . Un'unità di convoluzione riceve il suo input da più unità dal livello precedente che insieme creano una prossimità. Pertanto, le unità di input (che formano un piccolo quartiere) condividono i loro pesi.
Le unità di convoluzione (così come le unità di raggruppamento) sono particolarmente utili come:
- Riducono il numero di unità nella rete (poiché sono mappature molte-a-una ). Ciò significa che ci sono meno parametri da imparare che riducono la possibilità di overfitting poiché il modello sarebbe meno complesso di una rete completamente connessa.
- Considerano il contesto / informazioni condivise nei piccoli quartieri. Questo futuro è molto importante in molte applicazioni come elaborazione / mining di immagini, video, testi e sintesi vocale poiché gli input vicini (ad es. Pixel, cornici, parole, ecc.) Solitamente trasportano informazioni correlate.
Leggi quanto segue per ulteriori informazioni sulle CNN (profonde):
- Classificazione ImageNet con reti neurali profonde convoluzionali
- Andando più in profondità con le convoluzioni
ps ANN non è "un sistema basato vagamente sul cervello umano" ma piuttosto una classe di sistemi ispirati alle connessioni neuronali presenti nel cervello degli animali.