Precisione numerica nel metodo della somma dei quadrati?


13

Ho letto un po 'del metodo della somma dei quadrati (SOS) dall'indagine di Barak & Steurer e dagli appunti di Barak . In entrambi i casi spazzano via i problemi di precisione numerica sotto il tappeto.

Dalla mia comprensione (ammessa limitata) del metodo, dovrebbe essere vero quanto segue:

Dato qualsiasi sistema di uguaglianze polinomiali su variabili con valori reali , dove tutti i parametri sono ( , e grado di ciascun vincolo), il grado- " "( ) Il metodo SOS trova un'assegnazione soddisfacente delle variabili o dimostra che non ne esiste alcuna nel tempo . ExRnO(1)n|E|2n=O(1)O(1)

La mia prima domanda è se l'affermazione di cui sopra è vera (c'è un argomento ingenuo che non usa SOS per risolvere questo?). La seconda domanda è dove si inserisce l'accuratezza numerica. Se voglio ottenere un incarico che soddisfi tutti i vincoli entro l' accuratezza additiva , in che modo l'autonomia dipende da ? In particolare, è polinomiale?ε1/ε

La motivazione per questo è, per esempio, applicare un approccio di divisione e conquista su un sistema di grandi dimensioni fino a quando il caso base non è un sistema di dimensioni .O(1)

EDIT: Da Barak-Steurer, sembra che l' algoritmo "grado somma dei quadrati" a p.9 (e i paragrafi che lo precedono) definiscono tutti i problemi per soluzioni su , e in effetti il la definizione di una pseudo-distribuzione nella sezione 2.2 è finita . Ora sto vedendo da Lemma 2.2, tuttavia, che non è garantita una soluzione / confutazione al grado senza variabili binarie.lRR2n

Quindi posso affinare un po 'la mia domanda. Se le tue variabili non sono binarie, la preoccupazione è che la sequenza di output non sia finita (forse nemmeno un aumento monotonico?). Quindi la domanda è: è ancora in aumento? E se è così, quanto lontano devi andare per ottenere l'accuratezza additiva ?φ(l)φ(l)ε

Anche se questo probabilmente non cambia nulla, mi capita di conoscere il mio sistema è soddisfacibile (non v'è alcuna confutazione di qualsiasi grado), quindi sono davvero solo preoccupati per quanto grande deve essere. Infine, sono interessato a una soluzione teorica, non a un risolutore numerico.l


Risposte:


1

Ecco il commento di Boaz Barak sulla questione:

Approfondiamo l'accuratezza numerica sotto il tappeto - la letteratura SOS più "tradizionale" di Parrilo, Lasserre ecc. Affronta questi problemi (ad esempio, vedi i sondaggi di Monique Laurent e i riferimenti in essi). È noto che la gerarchia è monotona (non è difficile vedere che un grado psuedo-distribuzione è in particolare un grado l - 1 uno) e che converge in gradi finiti per qualsiasi insieme fisso di equazioni (questo è il Positivstellensatz). Il grado esatto potrebbe variare. In generale, se tutti i coefficienti dei polinomi sono limitati e si sta tentando di distinguere tra il caso in cui esiste una soluzione e il caso in cui in qualsiasi assegnazione una delle equazioni è disattivata di ϵ , si potrebbe discretizzare questo in unll1ϵ -net per δ in relazione al numero di variabili, grado di equazioni e ϵ , e quindi (supponendo che la rete sia sufficientemente "piacevole" e "simile a un cubo") il grado richiesto dovrebbe essere approssimativamente registrare la dimensione della rete.δδϵ


Inserito come risposta per evitare che il bot della comunità ritorni la domanda in futuro.
Kaveh,

1

Penso che la mia risposta sia probabilmente insufficiente, ma rimane per completezza (anche se vedi i commenti di Boaz di seguito per probabilmente una risposta migliore)

Quando ci limitiamo a variabili booleane, la pretesa può essere vista quando per tutti i [ n ] con l'osservazione che le pseudo-distribuzioni di grado 2 n sono distribuzioni effettive, cioè supponiamo di avere una pseudo-distribuzione μ ( x ) su soluzioni x delle tue uguaglianze polinomiali E soddisfacente:(xi21)Ei[n]2nμ(x)xE

ex { - 1 , 1 } n μ ( x ) p 2 ( x ) 0 per tutti i polinomi p con grado al massimo nx{1,1}nμ(x)x{1,1}nμ(x)p2(x)0pn

Ma i polinomi di grado includono l'indicatore polinomiale (ad esempio, x 1 = 1 , x 2 = - 1 , x 3 = 1 ha 2 - 3 ( 1 + x 1 ) ( 1 - x 2 ) ( 1 + x 3 ) che è tutto zero altrove e 1 su quell'assegnazione). Quindi μ ( x ) 0 per tutti x {nx1=1,x2=1,x3=123(1+x1)(1x2)(1+x3)μ(x)0 , così concludiamo μ è una distribuzione effettiva sulle soluzioni di E . La laurea pseudo-distribuzioni può essere trovata usando la programmazione semidefinita per trovare un grado operatore pseudo-aspettativaassociatoin n O ( ) tempo, quindi possiamo trovare la distribuzione effettiva μ nel tempo n O ( n ) usando quella pseudo- aspettativa (ora un'aspettativa effettiva) di trovare tutti i momenti di μ .x{1,1}nμEnO()μnO(n)μ

Quindi, se , quindi puoi trovare una distribuzione di soluzioni a E nel tempo O ( 1 ) . Naturalmente, la ricerca della forza bruta garantisce lo stesso.|E|=O(1)EO(1)

Tuttavia, se le soluzioni non sono necessariamente booleano, quindi degree- pseudo-aspettative non sono sufficienti per trovare una distribuzione rispetto alle soluzioni. Come si può vedere sopra, la prova che misura 2 n pseudo-distribuzioni sono distribuzioni effettivi dipende dal fatto che grado n polinomi sono sufficienti a 'scegliere' individuali assegnazione, che non è più in generale vero. Un altro modo di vederlo è che i polinomi a variabile booleana sono considerati2n2nn , quindi il grado di ogni monomio è al massimo n .mod(xi2)n

Ad esempio, si potrebbe considerare sostituendo ogni variabile binaria con una variabile 4-ario, diciamo includendo . Quindi dovresti avere un grado 4 n pseudo-aspettativa per garantire il recupero di una distribuzione rispetto alle soluzioni.(xi21)(xi24)E4n

Ora, per garanzie teoriche, sembra che l'approssimazione di una radice di un sistema di polinomi sia anche noto come il 17 ° problema di Smale, e apparentemente esiste un algoritmo di tempo polinomiale randomizzato (Las Vegas) che risolve questo problema - vedi http://arxiv.org /pdf/1211.1528v1.pdf . Si noti che questo sembra essere nel modello Blum-Shub-Smale, quindi le operazioni reali sono la primitiva. Non sono sicuro che questo dia la garanzia di cui hai bisogno.


Penso di non averlo chiarito: le mie variabili sono in R , poiché altrimenti potrei semplicemente fare una banale ricerca O ( 2 n ) = O ( 1 ) sull'ipercubo booleano. Ho aggiornato la domanda per riflettere questo. SDP / SOS si applica anche ai problemi di ottimizzazione dell'input reale, giusto? xiRO(2n)=O(1)
Jeremy Kun,

Oops, errore mio! Sì, si applica a impostazioni più generali, anche se molte volte supponiamo di essere sull'ipercubo. Ho aggiornato la mia risposta, anche se la mia risposta sarà meno chiara di quanto avessi sperato.
Joe Bebel,

10
Approfondiamo l'accuratezza numerica sotto il tappeto - la letteratura SOS più "tradizionale" di Parrilo, Lasserre ecc. Affronta questi problemi (ad esempio, vedi i sondaggi di Monique Laurent e i riferimenti in essi). È noto che la gerarchia è monotona (non è difficile vedere che un grado psuedo-distribuzione è in particolare un grado - 1 uno) e che converge in gradi finiti per qualsiasi insieme fisso di equazioni (questo è il Positivstellensatz). 1
Boaz Barak

9
..Il grado esatto potrebbe variare. In generale, se tutti i coefficienti dei polinomi sono limitati e si sta tentando di distinguere tra il caso in cui esiste una soluzione e il caso in cui in qualsiasi assegnazione una delle equazioni è disattivata di , si potrebbe discretizzare questo in un δ - net per δ in relazione al numero di variabili, grado di equazioni e ϵ , e quindi (supponendo che la rete sia sufficientemente "piacevole" e "simile a un cubo") il grado richiesto dovrebbe essere approssimativamente registrare la dimensione della rete. ϵδδϵ
Boaz Barak

4
@BoazBarak forse questa potrebbe essere una risposta?
Suresh Venkat,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.