Un modello di controllo ottimale: un risultato ridicolo per uno stato stazionario


7

Stavo sperimentando un problema di controllo ottimale apparentemente semplice che genera un sistema di equazioni differenziali. Quando calcolo i valori dello stato stazionario del sistema ottengo risultati molto strani, credo di aver fatto qualcosa di sbagliato quando ho applicato il Principio massimo. Se sei abbastanza paziente da leggere del testo, ti sarei grato di ascoltare i tuoi suggerimenti su cosa potrebbe andare storto.

Notazione

Uso un pedice t ogni volta che una variabile dipende dal tempo. Ad esempio At(x1,x2):=A(x1,x2,t)

Impostare

Immagina un'economia chiusa con una funzione di produzione lineare. La quantità di beni prodotti dipende dal livello di capitale umano At e un po 'di dotazione ressource fisso R . Così,

Yt:=AtR

L'economia che immaginiamo ha un ambiente insicuro e può essere attaccata a caso con una probabilità di (esogena). Ogni volta che un Paese viene attaccato, perde parte del suo reddito. Indico la quota rimanente q t . La quota di entrate protette dipende dalla quantità di spese militari che il paese ha aumentato del livello di capitale umano accumulato:pqt

qt:=11αAtmMt

Suppongo Quindi maggiore è la spesa militare, maggiore è la sicurezza delle entrate correnti. Si noti che la spesa militare fa lavoro migliore nel garantire protezione a patto che m < 1 .m[0,1]m<1

Dato tutto questo, assumere l'economia produce 3 tipi di merce: beni di consumo , beni militari M t e il capitale umano Una t . Supponiamo per semplicità che A t sia l'unica variabile che si accumula mentre i beni di consumo e i beni militari vengono consumati istantaneamente in ogni momento. Se uno concorda su questo, un modo per esprimere l'equazione del movimento per il capitale umano è la media ponderata del reddito che il paese ha meno la spesa per consumi, militari e deprezzamento del capitale umano:CtMtAtAt

A˙t=pqtYtPost-war income+(1p)YtNo-war incomeCtMtδAt

At,Mt>0U(Ct)>0,U(Ct)<0A(t=0)=A0

maxCt,Mt0U(Ct)eρtdt

In parole: massimizzare l'utilità sull'orizzonte infinito, guidando i consumi e i militari.

Tale che: E la condizione di trasversalità:

A˙t=p(11αAtmMt)AtR+(1p)AtRCtMtδAt
limt>eρtλtAt=0

Hamiltoniano e soluzione

Il valore attuale di Hamiltoniano è simile al seguente ( ): μt=λteρt

Hc=U(Ct)+μt(p(11αAtmMt)AtR+(1p)AtRCtMtδAt)

Chiang (1992) sostiene che se l'Hamiltoniano è non lineare nelle variabili di controllo e di stato, si ottengono le condizioni di primo ordine prendendo le derivate dell'Hamiltoniano e impostandole uguali a zero.

HcCt:U(Ct)μt=0

HcCt:μt(pAt1mR1αMt21)=0

μ˙t=ρμtμt(pRm1αAtmMt+Rδ)

Le espressioni per e formano un sistema di equazioni differenziali. Ma interpretare \ dot {\ mu} _t è controintuitivo. Invece, di solito si differenzia il FOC per il consumo rispetto al tempo e imputo \ dot {\ mu} _t dall'equazione del moto. Dato che , si può eliminare in . Tuttavia, il sistema sarà composto da due equazioni e tre variabili , , .μ˙tA˙tU(C)t=μ˙tU(Ct)=μtμtC˙tC˙t,A˙tAtCtMt

{C˙t=U(Ct)U(Ct)(pRm1αAtmMt+Rδρ)A˙t=AtRAt1mpRMtCtMtδAt

Ho bisogno di un modo per esprimere in funzione di altre variabili o parametri. Quindi prendo il secondo FOC, lo a zero (respingo l'opzione perché ) e ne in funzione di :Mtμt=0μt=U(Ct)>0MtAtMt:=At1m2pRα

Imputo nel sistema sopra, imposto e calcolo le espressioni per lo stato stazionario. Respingendo la banale soluzione , ottengo i seguenti valori di equilibrio:MtC˙t=A˙t=0Ct=0

Capitale umano

A¯t=(pRα(1m)2(Rδρ)2)11+m

Militare

Mt¯=(pRα(1m)2(Rδρ)2)1m2(1+m)pRα

Consumo

Ct¯=(pRα(1m)2(Rδρ)2)11+m(Rδ)(pRα(1m)2(Rδρ)2)1m2(1+m)αpR(1+1α)

L'espressione per il consumo sembra goffa. Lo è davvero! Quando ho provato a calcolare i valori del consumo dati alcuni parametri più o meno ragionevoli ( , , , , ), ho ottenuto numeri negativi . Uno screenshot di Mathematica che raffigura (asse verticale) in funzione di (asse orizzontale):p=0.052m=0.21δ=0.242α=2.54ρ=1.48CtRConsumo di stato stazionario con $ p = 0,052 $, $ m = 0,21 $, $ \ delta = 0,242 $, $ \ alpha = 2,54 $, $ \ rho = 1,48 $

Non mi aspetto che l'introduzione di diritti di proprietà insicuri cambierà il consumo dello stato stazionario in valori negativi data una funzione di produzione lineare. Sembra che abbia applicato l'algoritmo del Principio massimo in modo sbagliato ma non riesco a capire quale sia stato il mio errore. Qualcuno potrebbe indicarmi cosa è andato storto? Qualche idea? PS Sei un eroe se leggi fino alla fine :)

AGGIORNAMENTO: Come alcune delle persone qui suggerite, il Principio massimo fallisce perché applico il metodo deterministico a un modello stocastico. Questa è una preoccupazione seria. Ho deciso di verificare se il metodo funziona nel caso in cui ho impostato (implicando lo scenario di guerra infinitamente lungo per l'economia).p=1

Le equazioni canoniche con la specifica sembrano così:

HcCt:U(Ct)μt=0

HcCt:μt(pAt1mR1αMt21)=0

μ˙t=ρμtμt(RR1mαAtmMtδ)

Ho proceduto con la soluzione come prima e ho ottenuto il seguente sistema dinamico (supponendo :U(Ct)=lnCt

{C˙t=Ct(RR1mαAtmMt+Rδρ)A˙t=AtRAt1mRMtCtMtδAt

Risolvilo per lo stato stazionario. Ecco i miei valori di equilibrio per capitale umano, militare e consumo.

A¯=((1m)2(Rδρ)2Rα)11+m

M¯=(Rα)1/2((1m)2(Rδρ)2Rα)1m2(1+m)

C¯=(Rδ)((1m)2(Rδρ)2Rα)11+m2(Rα)1/2((1m)2(Rδρ)2Rα)1m2(1+m)

Ho simulato di nuovo i valori di . Ecco cosa ottengo: CtConsumo (asse verticale) in funzione della dotazione di risorse (asse orizzontale)

Equazioni diverse, ma immagine simile. Quindi la natura stocastica del modello non è l'unico problema. Forse mi manca qualcosa come una soluzione bang-bang qui? O forse semplicemente non esiste nel caso?


Benvenuti nel sito. Quando hai calcolato il consumo, quale valore hai assunto per ? R
Adam Bailey,

Grazie per un commento Ho dimenticato di dire che il grafico che vedi mostra il consumo in funzione della dotazione di risorse. . è sull'asse verticale e è sull'asse orizzontale. da 0 a Ct=g(R)CRR
10.000

@ArtemKochnev come sottolinea Alecos nella sua risposta di seguito, non credo che questo possa essere formulato come un problema di controllo deterministico. La tua scelta di e induce alcuni processi di salto per i quali avrai bisogno degli strumenti della teoria del controllo stocastico. Esiste un analogo del principio di Pontryagin per il controllo stocastico, ma per arrivarci è necessario disporre di strumenti piuttosto sofisticati. MC
Economista teorico

Grazie :) Penso che tu abbia ragione su questo, ma poi avrebbe dovuto scomparire dopo aver calcolato lo stato stazionario in una versione deterministica del modello ( ). Tuttavia, ho riscontrato lo stesso problema. Vedi l'aggiornamento sopra. p=1
Artem Kochnev,

Risposte:


4

Un problema generale che vedo è che si tenta di includere l'incertezza in un framework sviluppato per una configurazione deterministica.

Quello che fai è usare il reddito atteso nell'equazione del moto per il capitale umano. Lascia che denoti la funzione indicatore per l'attacco, prendendo il valore caso di attacco e il valore caso contrario. Quindi, correttamente,Ia,t10

A˙t=Ia,tqtYtPost-war income+(1Ia,t)YtNo-war incomeCtMtδAt

e quello che stai usando nel tuo modello è . Hmm ..., non sono sicuro che sia così semplice ... Hai cercato i macchinari di Stochastic Optimal Control in tempo continuo?E(A˙t)

A parte questo, vedo anche due valori di parametro che sono strani nella tua simulazione, tranne se c'è qualcosa che non ci dici.

1) significa deprezzamento del capitale umano del % per periodo. Qual è il tuo "periodo" qui? Concesso, questo è un tempo continuo, ma per valutare i risultati della simulazione e vedere se hanno senso, è necessario determinare una lunghezza discreta del "periodo di tempo". Un valore annuale di riferimento sarebbe , quindi il tuo corrisponde a un periodo di circa 7 anni.δ=0.24224.2δ=0.04

2) Il tasso di preferenza temporale pura è pari a ?? Come hai trovato un valore maggiore dell'unità? ... Per un periodo annuale un valore di riferimento è . Quindi, se vogliamo essere coerenti con il periodo di 7 anni implicito per il tasso di ammortamento, dovrebbe essere approssimativamente . Quindi, per essere coerente con il parametro , dovresti cambiare .ρ=1.48ρ=0.02ρ=0.132δρ

Ma questo non influirà sul risultato, come dovrebbe essere ovvio dalle tue equazioni, soprattutto dal momento che viene controllato per valori molto grandi rispetto.R

Infine, e ignorando tutto quanto sopra, non è il fatto che tu abbia introdotto "diritti di proprietà insicuri", è la forma funzionale specifica che hai scelto per incorporarli nel modello, che apparentemente causa tutti i problemi. Le forme matematiche sono strumenti e anche quando disponiamo di molti strumenti ragionevoli (la tua specifica della funzione non è irragionevole), non tutti sono appropriati per tutti i modelli. qt

Esistono molti altri modi per includere "diritti di proprietà insicuri", ad esempio: si potrebbe sostenere che la spesa militare influisce sulla probabilità di un attacco. È possibile scegliere di non includere il capitale umano nell'espressione per . Eccetera.qt

Quindi, se il problema con il modo in cui gestisci l'incertezza in linea di principio (il mio primo commento) non è un problema dopo tutto, allora dovresti semplicemente cambiare il modo in cui modelli la probabilità di attacco e / o perdita di output a causa dell'attacco.

Ricorda che stai solo costruendo un modello, ed è il modello che dovrebbe conformarsi alla realtà e alla ragione, non viceversa. E poiché il consumo in regime stazionario che diminuisce monotonicamente nella dotazione di risorse esogene non è ragionevole né realistico, è necessario modificare il modello. E ' non è il caso che si appena scoperto una legge sorprendente sul comportamento umano (non ancora almeno).

Sarebbe interessante per ottenere un risultato non monotona - dire per ss consumo di avere un minimo o un massimo - che sarebbe veramente allettante.R


Grazie per un commento Probabilmente non l'ho sottolineato molto: ciò che mi preoccupa è che il risultato non ha senso. Non avevo intenzione di dire "Guarda: ho trovato una legge della natura ridicola". Certo che no :) E dato che ho un risultato così confuso, ho pensato di aver fatto qualcosa di sbagliato. Per quanto riguarda il tuo suggerimento sul controllo stocastico. Penso che tu abbia ragione in linea di principio. Tuttavia, controlla i miei risultati nel modello deterministico che mostro nell'aggiornamento: ho ancora lo stesso problema. Pertanto, è probabile che mi manchi qualcos'altro.
Artem Kochnev,

@ArtemKochnev L'altra cosa che ho scritto nella mia risposta è che dovresti cambiare il modo in cui modelli la funzione per quanto riguarda la sua forma funzionale e gli argomenti che include. La tua scelta attuale per la sua forma funzionale dà risultati insensati e quindi dovrebbe essere abbandonata. qt
Alecos Papadopoulos,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.