Sto cercando di capire come funziona il metodo di ottimizzazione basato sull'aggiunta per un'ottimizzazione vincolata PDE. In particolare, sto cercando di capire perché il metodo aggiunto è più efficiente per problemi in cui il numero di variabili di progettazione è grande, ma il "numero di equazioni è piccolo".
Quello che ho capito:
Si consideri il seguente problema di ottimizzazione vincolata PDE:
dove è una funzione oggettiva (sufficientemente continua) di una variabile di disegno vettoriale e un vettore di variabili di campo sconosciute che dipendono dalle variabili di disegno, e è la forma residua del PDE.
Chiaramente, possiamo le prime variazioni di I e R come
Introducendo un vettore di moltiplicatori di lagrange , la variazione della funzione obiettivo può essere scritta come
Riorganizzando i termini, possiamo scrivere:
Quindi, se siamo in grado di risolvere per tale che∂ I
Quindi viene valutato il gradiente solo in termini di variabili di progettazione .β
Pertanto, un algoritmo di ottimizzazione basato su aggiunta verrebbe eseguito in sequenza sui seguenti passaggi:
- Date le variabili di progettazione correnti
- Risolvi per le variabili di campo (dal PDE)
- Risolvi per i moltiplicatori di lagrange (dall'equazione aggiunta)
- Calcola i gradienti
- Aggiorna variabili di progettazione
La mia domanda
In che modo questo "trucco" aggiunto migliora il costo dell'ottimizzazione per iterazione nel caso in cui il numero di variabili di progettazione sia elevato? Ho sentito che il costo della valutazione del gradiente per il metodo aggiunto è "indipendente" dal numero di variabili di progettazione. Ma com'è esattamente vero?
Sono sicuro che c'è qualcosa di molto ovvio che in qualche modo sto trascurando.