Domande taggate «reinforcement-learning»

Un insieme di strategie dinamiche grazie alle quali un algoritmo può apprendere online la struttura di un ambiente eseguendo in modo adattivo azioni associate a diversi premi in modo da massimizzare i premi ottenuti.

5
Qual è la differenza tra apprendimento off-policy e on-policy?
Il sito Web di intelligenza artificiale definisce l'apprendimento off-policy e on-policy come segue: "Uno studente fuori dalla politica impara il valore della politica ottimale indipendentemente dalle azioni dell'agente. Q-learning è uno studente fuori dalla politica. Uno studente nella politica apprende il valore della politica eseguita dall'agente, compresi i passaggi di …




2
Apprendimento supervisionato, apprendimento non supervisionato e apprendimento di rinforzo: nozioni di base sul flusso di lavoro
Apprendimento supervisionato 1) Un essere umano crea un classificatore basato su dati di input e output 2) Quel classificatore è addestrato con un set di dati di addestramento 3) Quel classificatore viene testato con un set di dati di test 4) Distribuzione se l' output è soddisfacente Da utilizzare quando, …


3
Analisi delle serie storiche giornaliere
Sto cercando di fare analisi delle serie storiche e sono nuovo in questo campo. Ho un conteggio giornaliero di un evento dal 2006 al 2009 e voglio adattarlo ad un modello di serie storica. Ecco i progressi che ho fatto: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) La trama risultante che ottengo è: …


2
Che cos'è l'apprendimento di rinforzo ricorrente
Di recente mi sono imbattuto nella parola "Recurrent Reinforcement Learning". Capisco cos'è la "Rete neuronale ricorrente" e cos'è "Apprendimento per rinforzo", ma non sono riuscito a trovare molte informazioni su cosa sia un "Apprendimento per rinforzo ricorrente". Qualcuno può spiegarmi cos'è un "Apprendimento di rinforzo ricorrente" e qual è la …

1
Quando scegliere SARSA vs. Q Learning
SARSA e Q Learning sono entrambi algoritmi di apprendimento per rinforzo che funzionano in modo simile. La differenza più evidente è che SARSA è in politica mentre Q Learning è fuori politica. Le regole di aggiornamento sono le seguenti: Q Learning: Q ( st, at) ← Q ( st, at) …






Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.