Supponiamo che tu voglia andare a pescare nel vicino lago dalle 8:00 alle 20:00. A causa della pesca eccessiva, è stata istituita una legge che dice che puoi pescare solo un pesce al giorno. Quando catturi un pesce, puoi scegliere di tenerlo (e quindi tornare a casa con quel pesce), oppure gettarlo di nuovo nel lago e continuare a pescare (ma rischi di sistemarti in seguito con un pesce più piccolo o nessun pesce). Vuoi catturare un pesce il più grande possibile; in particolare, vuoi massimizzare la massa di pesce prevista che porti a casa.
Formalmente, potremmo impostare questo problema come segue: i pesci vengono catturati a una certa velocità (quindi, il tempo necessario per catturare il tuo prossimo pesce segue una distribuzione esponenziale nota) e le dimensioni del pesce catturato seguono una distribuzione (anche conosciuta) . Vogliamo un processo decisionale che, dato il tempo corrente e le dimensioni di un pesce che hai appena pescato, decida se tenere il pesce o buttarlo indietro.
Quindi la domanda è: come dovrebbe essere presa questa decisione? Esiste un modo semplice (o complicato) per decidere quando smettere di pescare? Penso che il problema sia equivalente a determinare, per un dato tempo t, quale massa di pesce prevista un pescatore ottimale porterebbe a casa se iniziasse al tempo t; il processo decisionale ottimale manterrebbe un pesce se e solo se il pesce è più pesante di quella massa prevista. Ma sembra una sorta di autoreferenziale; stiamo definendo la strategia di pesca ottimale in termini di pesca ottimale e non sono del tutto sicuro di come procedere.