Come funzionano le reti contraddittorie generative?


12

Sto leggendo delle reti generative dell'avversario (GAN) e ho dei dubbi in merito. Finora, capisco che in un GAN ci sono due diversi tipi di reti neurali: uno è generativo ( ) e l'altro discriminante ( ). La rete neurale generativa genera alcuni dati che la rete neurale discriminativa giudica per correttezza. Il GAN ​​apprende passando la funzione di perdita a entrambe le reti.solD

Come fanno inizialmente le reti neurali discriminanti ( ) a sapere se i dati prodotti da sono corretti o no? Dobbiamo prima addestrare la quindi aggiungerla alla GAN con ?DsolDsol

Consideriamo la mia rete addestrata , che può classificare un'immagine con una precisione percentuale del 90%. Se aggiungiamo questa rete a un GAN c'è una probabilità del 10% che classificherà un'immagine errata. Se addestriamo un GAN con questa rete , avrà anche lo stesso errore del 10% nella classificazione di un'immagine? Se sì, allora perché i GAN mostrano risultati promettenti?DDD

Risposte:


4

Confronta i dati generati e reali

Tutti i risultati prodotti da G sono sempre considerati "errati" per definizione, anche per un ottimo generatore.

Fornisci alla rete neurale discriminativa un mix di risultati generati dalla rete del generatore e risultati reali da una fonte esterna, e poi li alleni per distinguere se il risultato è stato prodotto dal generatore o no - non stai confrontando " buoni "e" cattivi "risultati, stai confrontando risultati reali rispetto a quelli generati.Dsol

Ciò si tradurrà in una "evoluzione reciproca" poiché imparerà a trovare caratteristiche che separano i risultati reali da quelli generati e imparerà a generare risultati che sono difficili da distinguere dai dati reali.Dsol


2

D

DsolDD

Detto questo, l'utilizzo di questo scenario potrebbe essere un buon modo "senza supervisione" per migliorare il potere di classificazione delle reti neurali, in quanto forza il modello di generatore ad apprendere migliori caratteristiche dei dati reali e ad imparare a distinguere tra caratteristiche effettive e rumore, usando molti meno dati necessari per un tradizionale schema di apprendimento supervisionato.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.