Qual è la differenza tra una rete neurale e una rete di credenze profonde?


62

Ho l'impressione che quando le persone si riferiscono a una rete di "convinzioni profonde" si tratti sostanzialmente di una rete neurale ma di dimensioni molto grandi. È corretto o una rete di credenze profonde implica anche che l'algoritmo stesso è diverso (ovvero, nessuna rete neurale feed forward ma forse qualcosa con loop di feedback)?

Risposte:


59

"Reti neurali" è un termine generalmente utilizzato per indicare le reti neurali feedforward. Le reti neurali profonde sono reti neurali feedforward con molti livelli.

Una rete di credenze profonde non è la stessa di una rete neurale profonda.

Come hai sottolineato, una rete di credenze profonde ha connessioni non dirette tra alcuni livelli. Ciò significa che la topologia di DNN e DBN è diversa per definizione.

I layer non indirizzati nel DBN sono chiamati Restricted Boltzmann Machines. Questi livelli possono essere addestrati utilizzando un algoritmo di apprendimento non supervisionato (Contrastive Divergence) che è molto veloce (ecco un link ! Con i dettagli).

Alcuni altri commenti:

Le soluzioni ottenute con reti neurali più profonde corrispondono a soluzioni con prestazioni peggiori rispetto alle soluzioni ottenute per reti con 1 o 2 strati nascosti. Man mano che l'architettura si approfondisce, diventa più difficile ottenere una buona generalizzazione usando un Deep NN.

Nel 2006 Hinton ha scoperto che si potevano ottenere risultati molto migliori in architetture più profonde quando ogni strato (RBM) è pre-addestrato con un algoritmo di apprendimento non supervisionato (Contrastive Divergence). Quindi la rete può essere allenata in modo controllato usando la backpropagation al fine di "mettere a punto" i pesi.


La differenza principale tra la funzione di un DNN e DBN è che i DBN funzionano in entrambe le direzioni, in => out per la formazione, out => in per le previsioni?
ZAR,

5

" Una rete neurale profonda è una rete neurale artificiale feed-forward che ha più di uno strato di unità nascoste tra i suoi ingressi e le sue uscite. Ogni unità nascosta, , in genere utilizza la funzione logistica per mappare il suo input totale dallo strato sottostante , , allo stato scalare, che invia al livello sopra.jxjyj (Ref. (1)) ".

Detto questo, come menzionato da David: " le reti di credenze profonde hanno connessioni non dirette tra i due livelli superiori, come in un RBM ", che è in contrasto con le reti neurali feed-forward standard. In generale, il problema principale in un DNN riguarda la formazione di esso che è sicuramente più coinvolta di un singolo strato NN. (Non sto lavorando su NNs è appena successo, ho letto il giornale di recente.)

Riferimento: 1. Reti neurali profonde per la modellazione acustica nel riconoscimento vocale , di Geoffrey Hinton, Li Deng, Dong Yu, George Dahl, Abdel-Rahman Mohamed, Navdeep Jaitly, Andrew Senior, Vincent Vanhoucke, Patrick Nguyen, Tara Sainath ,, e Brian Kingsbury sulla rivista IEEE Signal Processing [82], novembre 2012 ( Link al documento originale in MSR )


1
Una rete BELIEF profonda di solito si riferisce a una rete profonda con pre-supervisione senza supervisione (macchine Boltzmann limitate impilate addestrate con divergenze contrastanti).
alfa,

5
@ user11852 Il documento a cui hai collegato fa una distinzione tra reti neurali profonde e reti di credenze profonde. Le reti di credenze profonde hanno connessioni non dirette tra i due livelli superiori, come in un RBM.
David J. Harris,

0

Sono contento di vedere i commenti di Alex qui. Ho spiegato alla gente che DL è una tipica rete neurale. Non c'è differenza nello schema di apprendimento. Una precedente ANN scritta in c (70s) ha un'opzione per impostare più livelli nascosti. In realtà ho testato per determinare se più livelli nascosti migliorano la precisione. Il numero di livelli non rende DL diverso da ANN.

Odio questo tipo di termini di marketing. Ora abbiamo così tanti esperti di DL che non sanno che DL è in realtà ANN. Poiché il marketing è così buono e forte, le persone credono che abbiamo progredito molto nell'area dell'apprendimento automatico. Ma niente è nuovo!


4
Ci sono nuove cose in realtà. È vero, le ANN erano conosciute molto prima dell'hype DL. Ciò che abbiamo appreso di recente sono i molti trucchi necessari per apprendere reti neurali così profonde. Con molta più potenza computazionale, abbiamo anche scoperto che le reti neurali sono fantastiche per immagini, audio e altri dati per i quali abbiamo avuto difficoltà a realizzare funzionalità manuali. C'è di più ovviamente.
Vladislavs Dovgalecs,

1
Questa risposta sembra essere più di un commento su una questione non correlata. Non vedo alcuna menzione di reti di credenze profonde.
Beldaz,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.