In che modo il rumore influisce sulla generalizzazione?


Risposte:


9

Il rumore nei dati, per un importo ragionevole, può aiutare la rete a generalizzare meglio. A volte, ha l'effetto opposto. Dipende in parte dal tipo di rumore ("vero" vs. artificiale).

Le FAQ AI sull'ANN offrono una buona panoramica. Estratto:

Il rumore nei dati effettivi non è mai una buona cosa, poiché limita l'accuratezza della generalizzazione che può essere raggiunta indipendentemente dall'estensione del set di addestramento. D'altra parte, l'iniezione di rumore artificiale (jitter) negli input durante l'allenamento è uno dei diversi modi per migliorare la generalizzazione per le funzioni fluide quando si ha un piccolo set di allenamento.

In alcuni campi, come la visione artificiale, è comune aumentare le dimensioni del set di addestramento copiando alcuni campioni e aggiungendo rumori o altre trasformazioni.


8

In genere pensiamo ai modelli di apprendimento automatico come a modellare due diverse parti dei dati di addestramento: la verità generalizzabile sottostante (il segnale) e la casualità specifica di quel set di dati (il rumore).

Il montaggio di entrambe le parti aumenta la precisione del set di allenamento, ma il montaggio del segnale aumenta anche la precisione del set di test (e le prestazioni del mondo reale), mentre il montaggio del rumore diminuisce entrambi. Quindi usiamo cose come la regolarizzazione e l'abbandono e tecniche simili al fine di rendere più difficile l'adattamento del rumore e quindi più probabilmente del segnale.

L'aumento della quantità di rumore nei dati di allenamento è uno di questi approcci, ma sembra improbabile che sia altrettanto utile. Confronta il jitter casuale con il potenziamento dell'avversario, ad esempio; il primo migliorerà lentamente e indirettamente la robustezza, mentre il secondo migliorerà drasticamente e direttamente.


1

PS: Ci sono già alcune risposte molto valide fornite qui, aggiungerò semplicemente a queste risposte nella speranza che qualcuno lo trovi utile:

L'introduzione del rumore in un set di dati può effettivamente avere un'influenza positiva su un modello. In realtà questo può essere visto come fare la stessa cosa che faresti normalmente con i regolarizzatori come l' abbandono . Alcuni degli esempi di ciò sono Zur at.al , Cires¸at.al in cui gli autori hanno introdotto con successo il rumore nel set di dati per ridurre l'eccessivo adattamento.

Il problema è sapere quanto rumore è troppo. Se aggiungi troppo rumore, questo potrebbe rendere inutile il tuo set di dati in quanto il set di dati risultante potrebbe non contenere più una somiglianza sufficiente con il set di dati originale, quindi potresti anche allenarti su un set di dati completamente diverso. Quindi si potrebbe vedere un rumore eccessivo per causare un montaggio insufficiente, proprio come tassi di abbandono estremamente elevati.

Come dice il proverbio; cambiare l' equilibrio è il sale della vita :).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.