È improbabile che ciò aggiunga molto al di là dei tuoi sforzi diretti nella raccolta dei dati.
La qualità delle attuali uscite GAN (a partire dal 2017) non sarà abbastanza elevata. Le immagini prodotte da un GAN sono in genere piccole e possono avere dettagli insoliti / ambigui e strane distorsioni. Nel documento che hai collegato, le immagini generate dal sistema da una frase hanno credibili blocchi di colore dati l'argomento, ma senza la frase che ti innesca cosa aspettarti la maggior parte di loro non è riconoscibile come nessun argomento specifico.
I GAN con uno scopo meno ambizioso rispetto alla generazione di immagini da frasi (che è nonostante la mia critica sopra, un'impresa IMO davvero notevole) dovrebbero produrre immagini più realistiche più vicine alle foto. Ma il loro ambito sarà inferiore e probabilmente non includerà il tipo di immagine desiderato. Inoltre, in genere la dimensione dell'output è piccola, ad esempio 64x64 o 128x128 *, e ci sono ancora abbastanza distorsioni e ambiguità che le foto originali di verità sul terreno sarebbero molto preferibili.
Il GAN è esso stesso limitato dalla libreria di training disponibile - non funzionerà bene se si tenta di generare immagini al di fuori dell'ambito dei suoi dati di training. I risultati mostrati nel documento di ricerca si concentrano ovviamente sul dominio fornito dai dati di formazione. Ma non puoi semplicemente inserire una frase in questo modello e aspettarti un risultato che sarebbe utile altrove.
Se trovi un GAN che è stato addestrato su un set di dati adatto al tuo problema, molto probabilmente stai meglio provando a cercare gli stessi dati direttamente per il tuo progetto.
Se stai affrontando un problema con dati di verità fondamentali limitati, forse un approccio migliore all'utilizzo di un GAN sarebbe quello di utilizzare un classificatore pre-addestrato come VGG-19 o Inception v5, sostituire gli ultimi pochi livelli completamente collegati e bene ottimizzalo sui tuoi dati. Ecco un esempio di ciò usando la libreria Keras in Python - altri esempi possono essere trovati con ricerche come "fine tuning classificatore di immagini CNN".
* I GAN all'avanguardia sono migliorati da quando ho pubblicato questa risposta. Un team di ricerca di Nvidia ha avuto un notevole successo nel creare immagini fotorealistiche 1024x1024 . Tuttavia, questo non cambia gli altri punti nella mia risposta. I GAN non sono una fonte affidabile di immagini per le attività di classificazione delle immagini, tranne forse per le attività secondarie di qualsiasi cosa la GAN sia già stata addestrata e sia in grado di generare in modo condizionale (o forse più banalmente, per fornire dati di origine per "altre" categorie in classificatori).