Statistiche e Big Data reinforcement-learning

1

Panoramica sugli algoritmi di apprendimento del rinforzo

Attualmente sto cercando una panoramica sugli algoritmi di apprendimento del rinforzo e forse una loro classificazione. Ma accanto a Sarsa e Q-Learning + Deep Q-Learning non riesco davvero a trovare alcun algoritmo popolare. Wikipedia mi offre una panoramica sui diversi metodi generali di apprendimento del rinforzo, ma non vi è …

9 reinforcement-learning q-learning

2

Apprendimento di rinforzo in ambiente non stazionario [chiuso]

Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 9 giorni fa . Q1: Esistono metodi comuni o accettati per affrontare l'ambiente non stazionario …

9 markov-process reinforcement-learning stationarity q-learning

4

Come interpretare una curva di sopravvivenza del modello di rischio Cox?

Come si interpreta una curva di sopravvivenza dal modello di rischio proporzionale cox? In questo esempio di giocattolo, supponiamo di avere un modello di rischio proporzionale cox su agevariabile nei kidneydati e generare la curva di sopravvivenza. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Ad esempio, al momento …

9 r survival cox-model likelihood machine-learning deep-learning generative-models machine-learning reinforcement-learning q-learning regression multicollinearity convergence beta-distribution bernoulli-distribution machine-learning self-study pattern-recognition neural-networks stochastic-processes linear

1

Quanto è efficiente il Q-learning con le reti neurali quando esiste un'unità di output per azione?

Contesto: sto usando l'approssimazione del valore Q della rete neurale nel mio compito di apprendimento di rinforzo. L'approccio è esattamente lo stesso di quello descritto in questa domanda , tuttavia la domanda stessa è diversa. In questo approccio il numero di risultati è il numero di azioni che possiamo intraprendere. …

9 machine-learning neural-networks reinforcement-learning q-learning

Domande taggate «reinforcement-learning»