Domande taggate «reinforcement-learning»

Un insieme di strategie dinamiche grazie alle quali un algoritmo può apprendere online la struttura di un ambiente eseguendo in modo adattivo azioni associate a diversi premi in modo da massimizzare i premi ottenuti.



4
Come interpretare una curva di sopravvivenza del modello di rischio Cox?
Come si interpreta una curva di sopravvivenza dal modello di rischio proporzionale cox? In questo esempio di giocattolo, supponiamo di avere un modello di rischio proporzionale cox su agevariabile nei kidneydati e generare la curva di sopravvivenza. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Ad esempio, al momento …

1
Quanto è efficiente il Q-learning con le reti neurali quando esiste un'unità di output per azione?
Contesto: sto usando l'approssimazione del valore Q della rete neurale nel mio compito di apprendimento di rinforzo. L'approccio è esattamente lo stesso di quello descritto in questa domanda , tuttavia la domanda stessa è diversa. In questo approccio il numero di risultati è il numero di azioni che possiamo intraprendere. …
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.