Precisione numerica nel metodo della somma dei quadrati?

Ho letto un po 'del metodo della somma dei quadrati (SOS) dall'indagine di Barak & Steurer e dagli appunti di Barak . In entrambi i casi spazzano via i problemi di precisione numerica sotto il tappeto.

Dalla mia comprensione (ammessa limitata) del metodo, dovrebbe essere vero quanto segue:

Dato qualsiasi sistema di uguaglianze polinomiali su variabili con valori reali , dove tutti i parametri sono ( , e grado di ciascun vincolo), il grado- " "( ) Il metodo SOS trova un'assegnazione soddisfacente delle variabili o dimostra che non ne esiste alcuna nel tempo . $E$ $x \in \mathbb{R}^n$ $O(1)$ $n$ $|E|$ $2n$ $=O(1)$ $O(1)$

La mia prima domanda è se l'affermazione di cui sopra è vera (c'è un argomento ingenuo che non usa SOS per risolvere questo?). La seconda domanda è dove si inserisce l'accuratezza numerica. Se voglio ottenere un incarico che soddisfi tutti i vincoli entro l' accuratezza additiva , in che modo l'autonomia dipende da ? In particolare, è polinomiale? $\varepsilon$ $1/\varepsilon$

La motivazione per questo è, per esempio, applicare un approccio di divisione e conquista su un sistema di grandi dimensioni fino a quando il caso base non è un sistema di dimensioni . $O(1)$

EDIT: Da Barak-Steurer, sembra che l' algoritmo "grado somma dei quadrati" a p.9 (e i paragrafi che lo precedono) definiscono tutti i problemi per soluzioni su , e in effetti il la definizione di una pseudo-distribuzione nella sezione 2.2 è finita . Ora sto vedendo da Lemma 2.2, tuttavia, che non è garantita una soluzione / confutazione al grado senza variabili binarie. $l$ $\mathbb{R}$ $\mathbb{R}$ $2n$

Quindi posso affinare un po 'la mia domanda. Se le tue variabili non sono binarie, la preoccupazione è che la sequenza di output non sia finita (forse nemmeno un aumento monotonico?). Quindi la domanda è: è ancora in aumento? E se è così, quanto lontano devi andare per ottenere l'accuratezza additiva ? $\varphi^{(l)}$ $\varphi^{(l)}$ $\varepsilon$

Anche se questo probabilmente non cambia nulla, mi capita di conoscere il mio sistema è soddisfacibile (non v'è alcuna confutazione di qualsiasi grado), quindi sono davvero solo preoccupati per quanto grande deve essere. Infine, sono interessato a una soluzione teorica, non a un risolutore numerico. $l$

optimization sum-of-squares

— Jeremy Kun
fonte

Somma di calcolo delle scomposizioni di quadrati con coefficienti razionali (2008)

— Rodrigo de Azevedo,

Risposte:

Ecco il commento di Boaz Barak sulla questione:

Approfondiamo l'accuratezza numerica sotto il tappeto - la letteratura SOS più "tradizionale" di Parrilo, Lasserre ecc. Affronta questi problemi (ad esempio, vedi i sondaggi di Monique Laurent e i riferimenti in essi). È noto che la gerarchia è monotona (non è difficile vedere che un grado psuedo-distribuzione è in particolare un grado uno) e che converge in gradi finiti per qualsiasi insieme fisso di equazioni (questo è il Positivstellensatz). Il grado esatto potrebbe variare. In generale, se tutti i coefficienti dei polinomi sono limitati e si sta tentando di distinguere tra il caso in cui esiste una soluzione e il caso in cui in qualsiasi assegnazione una delle equazioni è disattivata di , si potrebbe discretizzare questo in un $l$ $l-1$ $\epsilon$ -net per relazione al numero di variabili, grado di equazioni e , e quindi (supponendo che la rete sia sufficientemente "piacevole" e "simile a un cubo") il grado richiesto dovrebbe essere approssimativamente registrare la dimensione della rete. $\delta$ $\delta$ $\epsilon$

— Kaveh
fonte

Inserito come risposta per evitare che il bot della comunità ritorni la domanda in futuro.

— Kaveh,

Penso che la mia risposta sia probabilmente insufficiente, ma rimane per completezza (anche se vedi i commenti di Boaz di seguito per probabilmente una risposta migliore)

Quando ci limitiamo a variabili booleane, la pretesa può essere vista quando per tutti con l'osservazione che le pseudo-distribuzioni di grado sono distribuzioni effettive, cioè supponiamo di avere una pseudo-distribuzione su soluzioni delle tue uguaglianze polinomiali soddisfacente: $(x_i^2-1) \in E$ $i \in[n]$ $2n$ $\mu(x)$ $x$ $E$

e per tutti i polinomi con grado al massimo $\sum_{ x \in \{-1,1\}^n} \mu(x)$ $\sum_{x\in\{-1,1\}^n} \mu(x) p^2(x)\ge0$ $p$ $n$

Ma i polinomi di grado includono l'indicatore polinomiale (ad esempio, ha che è tutto zero altrove e 1 su quell'assegnazione). Quindi per tutti $n$ $x_1 = 1, x_2=-1, x_3=1$ $2^{-3}(1+x_1)(1-x_2)(1+x_3)$ $\mu(x) \ge 0$ , così concludiamo è una distribuzione effettiva sulle soluzioni di . La laurea pseudo-distribuzioni può essere trovata usando la programmazione semidefinita per trovare un grado operatore pseudo-aspettativaassociatoin tempo, quindi possiamo trovare la distribuzione effettiva nel tempo usando quella pseudo- aspettativa (ora un'aspettativa effettiva) di trovare tutti i momenti di . $x\in\{-1,1\}^n$ $\mu$ $E$ $\ell$ $\ell$ $n^{O(\ell)}$ $\mu$ $n^{O(n)}$ $\mu$

Quindi, se , quindi puoi trovare una distribuzione di soluzioni a nel tempo . Naturalmente, la ricerca della forza bruta garantisce lo stesso. $|E| = O(1)$ $E$ $O(1)$

Tuttavia, se le soluzioni non sono necessariamente booleano, quindi degree- pseudo-aspettative non sono sufficienti per trovare una distribuzione rispetto alle soluzioni. Come si può vedere sopra, la prova che misura pseudo-distribuzioni sono distribuzioni effettivi dipende dal fatto che grado polinomi sono sufficienti a 'scegliere' individuali assegnazione, che non è più in generale vero. Un altro modo di vederlo è che i polinomi a variabile booleana sono considerati $2n$ $2n$ $n$ , quindi il grado di ogni monomio è al massimo . $\mod(x_i^2)$ $n$

Ad esempio, si potrebbe considerare sostituendo ogni variabile binaria con una variabile 4-ario, diciamo includendo . Quindi dovresti avere un grado pseudo-aspettativa per garantire il recupero di una distribuzione rispetto alle soluzioni. $(x_i^2-1)(x_i^2-4) \in E$ $4n$

Ora, per garanzie teoriche, sembra che l'approssimazione di una radice di un sistema di polinomi sia anche noto come il 17 ° problema di Smale, e apparentemente esiste un algoritmo di tempo polinomiale randomizzato (Las Vegas) che risolve questo problema - vedi http://arxiv.org /pdf/1211.1528v1.pdf . Si noti che questo sembra essere nel modello Blum-Shub-Smale, quindi le operazioni reali sono la primitiva. Non sono sicuro che questo dia la garanzia di cui hai bisogno.

— Joe Bebel
fonte

Penso di non averlo chiarito: le mie variabili

sono in

, poiché altrimenti potrei semplicemente fare una banale ricerca

sull'ipercubo booleano. Ho aggiornato la domanda per riflettere questo. SDP / SOS si applica anche ai problemi di ottimizzazione dell'input reale, giusto?

x_{i}

$x_i$

R

$\mathbb{R}$

O (2^{n}) = O (1)

$O(2^n) = O(1)$

— Jeremy Kun,

Oops, errore mio! Sì, si applica a impostazioni più generali, anche se molte volte supponiamo di essere sull'ipercubo. Ho aggiornato la mia risposta, anche se la mia risposta sarà meno chiara di quanto avessi sperato.

— Joe Bebel,

Approfondiamo l'accuratezza numerica sotto il tappeto - la letteratura SOS più "tradizionale" di Parrilo, Lasserre ecc. Affronta questi problemi (ad esempio, vedi i sondaggi di Monique Laurent e i riferimenti in essi). È noto che la gerarchia è monotona (non è difficile vedere che un grado

psuedo-distribuzione è in particolare un grado

uno) e che converge in gradi finiti per qualsiasi insieme fisso di equazioni (questo è il Positivstellensatz).

ℓ

$\ell$

ℓ - 1

$\ell-1$

— Boaz Barak

..Il grado esatto potrebbe variare. In generale, se tutti i coefficienti dei polinomi sono limitati e si sta tentando di distinguere tra il caso in cui esiste una soluzione e il caso in cui in qualsiasi assegnazione una delle equazioni è disattivata di

, si potrebbe discretizzare questo in un

- net per

relazione al numero di variabili, grado di equazioni e

, e quindi (supponendo che la rete sia sufficientemente "piacevole" e "simile a un cubo") il grado richiesto dovrebbe essere approssimativamente registrare la dimensione della rete.

ϵ

$\epsilon$

δ

$\delta$

δ

$\delta$

ϵ

$\epsilon$

— Boaz Barak

@BoazBarak forse questa potrebbe essere una risposta?

— Suresh Venkat,