Quando si progettano soluzioni a problemi come Lunar Lander su OpenAIGym , Reinforcement Learning è un mezzo allettante per fornire all'agente un adeguato controllo dell'azione per atterrare con successo.
Ma quali sono i casi in cui gli algoritmi del sistema di controllo, come i controller PID , farebbero proprio un lavoro adeguato come, se non meglio, Reinforcement Learning?
Domande come questa fanno un ottimo lavoro per affrontare la teoria di questa domanda, ma fanno poco per affrontare la componente pratica.
Come ingegnere di intelligenza artificiale, quali elementi di un dominio problematico dovrebbero suggerirmi che un controller PID è insufficiente per risolvere un problema e invece dovrebbe essere usato un algoritmo di Reinforcement Learning (o viceversa)?