Come funziona la ricerca di novità?


16

In questo articolo , l'autore afferma che guidare l'evoluzione attraverso la sola novità (senza obiettivi espliciti) può risolvere i problemi anche meglio dell'uso di obiettivi espliciti. In altre parole, l'utilizzo di una misura di novità come funzione di fitness per un algoritmo genetico funziona meglio di una funzione di fitness orientata agli obiettivi. Come è possibile?

Risposte:


7

Come spiegato in una risposta a questa domanda AI SE , le GA sono "soddisfacenti" piuttosto che "ottimizzatori" e tendono a non esplorare le regioni "periferiche" dello spazio di ricerca. Piuttosto, la popolazione tende a raggrupparsi in regioni che sono "abbastanza buone" in base alla funzione fitness.

Al contrario, credo che il pensiero sia che la novità offra una sorta di forma fisica dinamica, che tende a allontanare la popolazione dalle aree precedentemente scoperte.


6

La ricerca di novità seleziona "comportamento nuovo", secondo una definizione di novità dipendente dal dominio. Ad esempio, la novità in un dominio che risolve il labirinto potrebbe essere la "differenza di percorso esplorata". Alla fine, verranno individuate le reti che percorrono ogni possibile percorso attraverso il labirinto e quindi è possibile selezionare il più veloce. Funzionerebbe molto meglio di un "obiettivo" ingenuo, come la distanza dall'obiettivo, che potrebbe facilmente portare a un optima locale che non risolve mai il labirinto.

Da Abandoning Objectives: Evolution through the Search for Novelty Alone (sottolineatura mia):

Nella ricerca di novità, invece di misurare il progresso complessivo con una funzione oggettiva tradizionale, l'evoluzione utilizza una misura di novità comportamentale chiamata metrica di novità. In effetti, una ricerca guidata da tale metrica esegue esplicitamente ciò che l'evoluzione naturale fa passivamente, cioè accumulando gradualmente nuove forme che salgono nella scala della complessità.
Ad esempio, in un dominio di locomozione bipede, i tentativi iniziali potrebbero semplicemente cadere. La metrica della novità ricompenserebbe semplicemente cadendo in un modo diverso, indipendentemente dal fatto che sia più vicina al comportamento oggettivo o meno. Al contrario, una funzione oggettiva può premiare esplicitamente la caduta più lontana, il che probabilmente non porta all'obiettivo finale di camminare e quindi esemplifica un ingannevole ottimale locale. Al contrario, nella ricerca di novità, viene mantenuta una serie di istanze che rappresentano le scoperte più nuove. Ulteriore ricerca quindi salta fuori da questi comportamenti rappresentativi. Dopo aver scoperto alcuni modi per cadere, l'unico modo per essere ricompensati è trovare un comportamento che non cade immediatamente . In questo modo, la complessità comportamentale sale dal basso verso l'alto.Alla fine, per fare qualcosa di nuovo, il bipede dovrebbe camminare con successo per una certa distanza anche se non è un obiettivo .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.