Rammarico interno nell'ottimizzazione convessa online


19

L '"ottimizzazione convessa online" di Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) generalizza gli algoritmi di apprendimento della "minimizzazione del rimpianto" da un'impostazione lineare a un'impostazione convessa e dà un buon "rimpianto esterno" . Esiste una generalizzazione simile per il rimpianto interno? (Non sono del tutto sicuro nemmeno cosa significherebbe esattamente.)


È possibile aggiungere una breve descrizione del rimpianto interno alla domanda?
Moritz,

Nella solita impostazione di "esperti", il rimpianto interno significherebbe che in retrospettiva non si vorrebbe passare da un'azione all'altra, coerentemente su tutta la storia. Il documento di Blum-Mansour è probabilmente il miglior riferimento per rimpianti interni contro esterni: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Noam

Risposte:


9

Prova "Apprendimento senza rimpianti nei giochi convessi" di Gordon, Greenwald e Marks http://portal.acm.org/citation.cfm?id=1390202 . Il suo suono astratto sembra come se probabilmente rispondesse alla tua domanda, o almeno chiunque rispondesse a tale domanda citerebbe o sarebbe citato da quel documento.


0

Questo documento di Avrim Blum indica una connessione tra rimpianto esterno e interno. Secondo il suo abstract, il rimpianto esterno è una misura di quanto un algoritmo viene confrontato con la migliore azione fissa, mentre il rimpianto interno viene confrontato con la migliore variazione di quel metodo (migliore permutazione fissa degli output, come la classe di segnalazione A ogni volta che l'algoritmo originale riportava classe B).


1
Il documento di Blum-Mansour non si trova nell'impostazione "ottimizzazione convessa online", ma piuttosto nell'impostazione lineare "esperti". La mia domanda è se qualcosa di simile o qualche altro algoritmo di rimpianto interno diretto possa essere applicato nell'impostazione convessa.
Noam,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.