Sto insegnando un corso di indagine di analisi numerica e sto cercando la motivazione per il metodo BFGS per gli studenti con background / intuizione limitati nell'ottimizzazione!
Anche se non ho il tempo di dimostrare rigorosamente che tutto converge, sto cercando di dare una motivazione ragionevole per cui potrebbe apparire l'aggiornamento di BFGS Hessian. Come analogia, il metodo di ricerca della radice di Broyden (il mio articolo è qui ) può essere motivato chiedendo che la tua attuale approssimazione del giacobino minimizzi la differenza con il vecchio giacobino soggetto al vincolo che tiene conto dell'ultima secante: J_k (\ vec x_k- \ vec x_ {k-1}) = f (\ vec x_k) -f (\ vec x_ {k-1 }) . J k ( → x k - → x k - 1 ) = f ( → x k ) - f ( → x k - 1 )
Le derivazioni degli aggiornamenti di BFGS sembrano molto più coinvolte e oscure! In particolare, mi piacerebbe non assumere a priori che l'aggiornamento dovrebbe essere di livello 2 o assumere una forma particolare. Esiste una breve motivazione dall'aspetto variazionale per l'aggiornamento BFGS Hessian come quello per Broyden?