In che modo una tela convoluzionale differisce da una normale rete convoluzionale?


9

Attualmente sto lavorando per ricreare i risultati di questo documento . Nel documento descrivono un metodo per usare la CNN per l'estrazione delle caratteristiche e hanno un modello acustico che è Dnn-hmm e prefabbricato usando RBM.

La sottosezione A della sezione III indica diversi modi in cui i dati di input possono essere rappresentati. Ho deciso di impilare verticalmente i grafici dello spettro dei delta statici, delta e delta.

Quindi come tale: inserisci qui la descrizione dell'immagine

L'articolo descrive quindi come dovrebbe essere la rete. Dichiarano di usare una rete convoluzionale, ma nulla sulla struttura della rete ?. Inoltre, la rete viene sempre definita come uno strato convoluzionale? di cui sono sicuro di vedere qualche differenza rispetto a una normale rete neurale convoluzionale (CNN).

L'articolo afferma ciò per quanto riguarda la differenza:

(dalla sezione III sottosezione B)

Tuttavia, una piega di convoluzione differisce da uno strato nascosto standard completamente connesso in due aspetti importanti. Innanzitutto, ogni unità convoluzionale riceve input solo da un'area locale dell'input. Ciò significa che ogni unità rappresenta alcune caratteristiche di una regione locale dell'input. In secondo luogo, le unità dello strato di convoluzione possono esse stesse essere organizzate in una serie di mappe caratteristiche, in cui tutte le unità nella stessa mappa caratteristica condividono gli stessi pesi ma ricevono input da posizioni diverse del livello inferiore

Un'altra cosa che mi chiedevo è se la carta indica effettivamente quanti parametri di output sono necessari per alimentare il modello acustico dnn-hmm. Non riesco a decodificare il numero di filtri, le dimensioni dei filtri .. nei dettagli generali della rete?


Mi interessa anche questo. Immagino di poter iniziare una taglia per accelerare il processo.
Lamda,

Risposte:


4

Sembra che una tela convoluzionale sia esattamente la stessa di un normale strato convoluzionale. Dal loro articolo, sostengono che il termine "strato della CNN" di solito si riferisce a uno strato convoluzionale seguito da uno strato di raggruppamento. Nel tentativo di ridurre la confusione, chiamano la parte convoluzionale un "strato di convoluzione" e una parte del raggruppamento un "strato di raggruppamento":

Nella terminologia della CNN, una coppia di livelli di convoluzione e raggruppamento nella Fig. 2 in successione viene generalmente indicata come uno "strato" della CNN. Una CNN profonda consiste quindi in due o più di queste coppie in successione. Per evitare confusione, faremo riferimento ai livelli di convoluzione e pooling rispettivamente come strati di convoluzione e pooling.

Ironia della sorte, questo ha aumentato la confusione, portando a questo post. Al momento suppongo che non fosse comune avere più strati convoluzionali di seguito prima di un livello di raggruppamento, ma lo vediamo spesso nelle architetture moderne.

Per rispondere a un'altra domanda sulla struttura della rete; dichiarano la struttura della rete che usano nella sezione Esperimenti (Sezione VB). Per spera ridurre la confusione, ho sostituito la parola "ply" con "livello":

In questi esperimenti abbiamo usato una convoluzione [layer], un pool [layer] e due layer nascosti completamente collegati in alto. Gli strati completamente collegati avevano 1000 unità ciascuno. I parametri di convoluzione e pool erano: dimensione del pool di 6, dimensione dello shift di 2, dimensione del filtro di 8, 150 mappe delle caratteristiche per FWS e 80 mappe delle caratteristiche per banda di frequenza per LWS.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.