L'importanza di Integrality Gap


44

Ho sempre avuto difficoltà a comprendere l'importanza del gap di integralità (IG) e limiti ad esso. IG è il rapporto tra (la qualità di) una risposta intera ottimale a (la qualità di) una soluzione reale ottimale del rilassamento del problema. Consideriamo la vertex cover (VC) come esempio. VC può essere dichiarato come trovare una soluzione intera ottimale del seguente insieme di equazioni lineari:

Abbiamo zero / uno variabili valutate s per ogni vertice del grafo . Le equazioni sono: per e per ciascun bordo . Siamo alla ricerca di valori che minimizzeranno .xvvV(G)G0xv1vV(G)1xv+xuuvE(G)vV(G)xv

Il rilassamento di questo problema consente valori reali compresi tra e quindi lo spazio delle soluzioni è maggiore e una soluzione reale ottimale può essere più piccola di una soluzione intera ottimale che vogliamo trovare. Pertanto è necessario eseguire un processo di "arrotondamento" sulla risposta reale ottimale ottenuta dalla programmazione lineare per trovare una soluzione intera. La soluzione intera ottimale sarà tra la soluzione reale ottimale e il risultato del processo di arrotondamento. IG è il rapporto tra una soluzione intera ottimale e una soluzione reale ottimale e non dice nulla sul processo di arrotondamento. Il processo di arrotondamento può (in teoria) ignorare completamente la soluzione reale e calcolare direttamente la soluzione intera ottimale.01

Perché le persone sono interessate a dimostrare limiti su IG?


8
Due non risposte: (1) Informatica empirica. Abbastanza spesso (certamente non sempre!) Sembra che il divario di integralità ≈ la durezza di approssimazione, almeno sotto alcune ipotesi. Quindi, se non hai idea di quanto sia difficile approssimare il problema X, dimostrare limiti stretti sul divario di integralità potrebbe darti un'ipotesi colta. Hai almeno una congettura che puoi provare a dimostrare. (2) Se il tuo algoritmo rompe il divario di integralità, allora potrebbe essere un segno che l'algoritmo sta facendo qualcosa di interessante (come lo sfruttamento delle belle proprietà combinatorie del problema specifico).
Jukka Suomela,

3
Charles, le lacune di integralità sono un'area attiva nella teoria della complessità in questi giorni. Spesso le persone dimostrano lacune per le famiglie numerose di rilassamenti (piuttosto che un singolo rilassamento). In questo caso puoi pensare a tali risultati come a dimostrare limiti inferiori rispetto a un modello computazionale interessante. Ci sono anche connessioni profonde alla complessità della prova.
Moritz,

Risposte:


30

Le lacune di integralità rappresentano essenzialmente i limiti intrinseci di un particolare rilassamento lineare o convesso nell'approssimazione di un programma intero. In generale, se il divario di integralità di un particolare rilassamento è , qualsiasi algoritmo di approssimazione basato su quel rilassamento non può sperare di fare meglio di una approssimazione x . Quindi, almeno, i divari di integrità sono interessanti per i progettisti di algoritmi poiché suggeriscono limitazioni in alcune tecniche. xx

Quindi, perché non venire semplicemente con un altro rilassamento LP o passare ad altre tecniche e andare avanti? La programmazione lineare e convessa si è dimostrata centrale negli algoritmi di approssimazione; per molti problemi il divario di integrità di una formulazione LP o SDP naturale è uguale al rapporto di approssimazione del miglior algoritmo e alla durezza del rapporto di approssimazione. Questa è solo un'osservazione empirica, ma significa che la dimostrazione di un gap di integralità può suggerire conseguenze molto più forti di un algoritmo migliorato o di un limite inferiore.

Ci possono essere ragioni più profonde e più rigorose per questo fenomeno. Ad esempio, supponendo l'esclusiva congettura dei giochi, è noto che il rapporto di approssimazione e il rapporto di inapproximabilità per problemi di soddisfazione dei vincoli è uguale al divario di integrità di un semplice rilassamento di SDP (vedi Algoritmi ottimali e risultati di inapproximabilità per ogni CSP? Di Prasad Raghavendra)

Infine, le lacune di integralità rappresentano limiti inferiori incondizionati . Di solito, dobbiamo fare affidamento su ipotesi non comprovate (ad esempio ) se vogliamo fare progressi in limiti inferiori, ma per modelli di calcolo ristretti, a volte possiamo scappare senza di essa (vedi le note di Luca Trevisan). I divari di integrità, essendo puramente geometrici piuttosto che computazionali, sono un modo per ottenere limiti inferiori abbastanza potenti senza il bagaglio di ipotesi extra.PNP


21

Supponiamo che il vostro problema di interesse è un problema di minimizzazione e di aver sviluppato un algoritmo di -approximate. Se, su un dato input, il tuo algoritmo genera una soluzione di costo c , allora il calcolo dell'algoritmo più la sua analisi danno un certificato che, su quell'input, l'ottimale è almeno a / c . Chiaramente, a è almeno l'ottimale, quindi per ogni input siamo in grado di certificare un limite inferiore all'ottimale che è almeno una frazione 1 / c dell'ottimale stesso.aca/ca1/c

In tutti gli algoritmi basati su rilassamenti convessi (LP e SDP) di cui sono a conoscenza, il limite inferiore certificato all'ottimale è dato dall'ottimale del rilassamento. Se il rilassamento ha un gap di integralità , allora non sarà possibile ottenere un rapporto di approssimazione migliore di I , a meno che nell'analisi non si introduca una tecnica di limite inferiore per l'ottimale che è più forte del limite inferiore fornito dal rilassamento.II


17

Il divario di integralità è un utile indicatore del grado di approssimazione di un IP. Potrebbe essere meglio pensarlo in modo informale e intuitivo. Un elevato divario di integralità implica che alcuni metodi non funzioneranno. Alcuni metodi primari / doppi, ad esempio, dipendono da un piccolo divario di integrità. Per la versione standard di Vertex Cover LP, il doppio LP richiede una corrispondenza massima. In questo caso, possiamo fare quanto segue:

  • trova una soluzione frazionaria ottimale al doppio LP (una corrispondenza frazionaria massima)y
  • moltiplica la soluzione per un fattore 2 (raddoppia i pesi di tutti i bordi)y
  • x2yxximin(xi,1)

In questo caso questa semplice strategia funziona e finiamo con una soluzione integrale fattibile per l'LP primario il cui peso non è più del doppio del peso di una soluzione fattibile per l'LP doppio. Poiché il peso di una soluzione fattibile per il doppio LP è un limite inferiore per OPT, questo è un algoritmo di approssimazione 2.

Ora, da dove viene il divario di integralità? L'IG è 2 in questo caso, ma questo da solo non implica che l'algoritmo funzionerà. Piuttosto, suggerisce che potrebbe funzionare. E se IG fosse superiore a 2, garantirebbe che la strategia semplice non funzionasse sempre. Come minimo dovremmo moltiplicare la doppia soluzione per IG. Quindi il divario di integrità a volte ci dice cosa non funzionerà. Il divario di integralità può anche indicare quale tipo di fattore di approssimazione possiamo sperare. Un piccolo divario di integralità suggerisce che investigare strategie di arrotondamento, ecc., Potrebbe essere un approccio utile.

Per un esempio più interessante, prendi in considerazione il problema dell'Hitting Set e la potente tecnica di approssimazione del problema usando -nets (Brönnimann & Goodrich, 1995) . Molti problemi possono essere formulati come istanze di Hitting Set, e una strategia che ha avuto successo per molti problemi è fare questo, quindi basta trovare un buon cercatore di reti, cioè un algoritmo per costruire piccole reti , e far girare tutto attraverso il meta-algoritmo B&G. Quindi le persone (me compreso) cercano di trovare net finder per istanze limitate di Hitting Set che, per qualsiasi , possono costruire una -net di dimensioni , dove la funzioneε ε ε f ( 1 / ε ) f f ( 1 / ε ) = O ( 1 / ε ) O ( 1 )εεεεf(1/ε)fdovrebbe essere il più piccolo possibile. Avere è un obiettivo tipico; questo darebbe una approssimazione .f(1/ε)=O(1/ε)O(1)

A quanto pare, la migliore funzione possibile è limitata dal divario di integrità di un certo LP per Hitting Set (Even, Rawitz, Shahar, 2005) . In particolare, le soluzioni integrali e frazionarie ottimali soddisfano . Per istanze illimitate di Hitting Set il divario di integralità è , ma quando si formula un altro problema come Hitting Set, l'IG può essere inferiore. In questo esempio gli autori mostrano come trovare -nets di dimensioneO P T If ( O P T f ) Θ ( log ( m ) ) εfOPTIf(OPTf)Θ(log(m))εO((1/ε)loglog(1/ε))per le istanze limitate di Hitting Set che corrispondono al problema di colpire le caselle degli assi paralleli. In questo modo migliorano il fattore di approssimazione più noto per quel problema. È un problema aperto se questo può essere migliorato o meno. Se, per queste istanze di Hitting Set limitate, l'IG per il LP Hitting Set è , sarebbe impossibile progettare net finder garantendo -nets di dimensione , dal momento che ciò implicherebbe l'esistenza di un algoritmo che garantisce insiemi di colpire integrali di dimensione , ma daΘ(loglogm)εo((1/ε)loglog(1/ε)) O P T fmo(OPTfloglogOPTf)OPTfmciò implicherebbe un divario di integrità minore. Quindi, se il divario di integralità è grande, dimostrarlo potrebbe impedire alle persone di perdere tempo alla ricerca di buoni cercatori di rete.


13

Quando ti viene in mente un algoritmo di approssimazione per qualche problema di massimizzazione NP-difficile, ci sono diversi valori che potrebbero interessarti: c'è OPT, il valore ottimale del tuo problema, che è lo stesso di OPT (IP), l'ottimale valore di qualsiasi corretta formulazione IP del problema. C'è anche OPT (LP), il valore ottimale del rilassamento lineare del tuo IP.

OPT(LP)OPT(IP)

Infine, c'è V, il valore della soluzione che si ottiene ottenendo arrotondando la soluzione LP. Vorresti essere in grado di dimostrare che per mostrare che il tuo algoritmo è un'approssimazione , ma spesso non è possibile farlo direttamente, poiché non hai un mantieni lo spazio della soluzione. Invece, ciò che è quasi sempre dimostrato è che . Questo ovviamente implica , ma è più forte. In particolare, se il divario di integralità della formulazione IP è maggiore di , l'affermazione di cui sopra sarà falsa in generale, poiché la procedura di arrotondamento termina con una soluzione integrale. cVOPT(LP)V>OPT(IP)cc V>OPT(IP)VOPT(LP)c cV>OPT(IP)cc

Quindi il punto cruciale è questo: l'LP ti offre una soluzione che sai essere "buona", e vuoi arrotondarla a qualcosa che è "quasi altrettanto buono". Se il divario di integralità è grande, questo è impossibile in generale, poiché non ci sarà mai una procedura che garantisca una soluzione integrale "altrettanto buona" come una soluzione LP - perché a volte non esistono!


12

Hai ragione nel dire che il divario di integrità di un rilassamento non ha nulla a che fare con nessun algoritmo di arrotondamento. Queste sono due nozioni diverse. Un gap di integralità è una proprietà di un particolare rilassamento. Cioè, quanto è più grande il valore di quel rilassamento rispetto al valore integrale ottimale?

Perché ci preoccupiamo dei rilassamenti lineari / convessi? Per approssimare efficacemente un valore integrale. Quindi, in genere parliamo di rilassamenti solo nei casi in cui il valore ottimale è difficile da calcolare e siamo interessati a approssimazioni efficienti. I divari di integrità ci mostrano i limiti intrinseci di ciò che può essere raggiunto con tali tecniche.

Quindi, perché ci preoccupiamo di arrotondare gli algoritmi oltre al rilassamento? Usiamo gli algoritmi di arrotondamento per risolvere il problema algoritmico di trovare una soluzione quasi ottimale invece di approssimare il valore di una soluzione ottimale. Inoltre, spesso vengono utilizzati algoritmi di arrotondamento per limitare innanzitutto il divario di integrità di un rilassamento.


Esattamente, sembra che le persone siano interessate alle formulazioni IP e ai loro rilassamenti a causa degli algoritmi di approssimazione per il problema originale, ma non capisco cosa impariamo sugli algoritmi di approssimazione risultanti dimostrando un legame con IG.
Kaveh,

11

Tecnicamente, il gap di integralità è per una specifica formulazione IP, non (come è stata formulata) la razione tra il miglior rilassamento lineare e la soluzione ottimale (che sembra quantificare su TUTTE le formulazioni IP).

cc


Ciao Suresh. Grazie, sapevo che IG è per una specifica formulazione IP, scusate se non l'ho dichiarato correttamente. Quello che non capisco è la relazione di IG con gli algoritmi di approssimazione e la risposta finale che otteniamo alla fine del processo di arrotondamento. Mi sembra che IG sia una proprietà geometrica di uno specifico rilassamento reale al problema originale e la sua relazione con gli algoritmi di approssimazione non è chiara per me. Voglio saperne di più sui motivi che rendono interessanti i limiti su IG, specialmente per quanto riguarda gli algoritmi di approssimazione.
Kaveh,

Ciao Kaveh, ho cercato di chiarire specificamente quei punti nella mia risposta. Forse aiuta.
Moritz,

3
Una risposta particolarmente affascinante alla tua domanda è l'attacco Swart su P vs NP attraverso il tentativo di costruire un programma lineare per TSP che avesse soluzioni intere. Mihalis Yannakakis ha scritto questo bellissimo documento che ha poi dimostrato che NESSUN rilassamento simmetrico di TSP ha ammesso una formulazione di poli dimensioni con soluzioni intere ( dx.doi.org/10.1016/0022-0000(91)90024-Y ).
Suresh Venkat,

6

C'era un documento molto interessante "Sul vantaggio della codifica di rete per migliorare la produttività della rete" che mostrava che il divario di integrità del "rilassamento del taglio bidirezionale" per il problema dell'albero di Steiner equivale esattamente a un tipo di "vantaggio di codifica" nella comunicazione di rete. Non conosco molti altri documenti simili. Tuttavia, si dovrebbe anche notare che sono noti rilassamenti LP apparentemente migliori per il problema dell'albero di Steiner (ad esempio, vedere il nuovo algoritmo di approssimazione basato su LP ipergrafico di Byrka et al in STOC 2010, mi sono anche volontariamente spudorato di aver coautore di alcuni articoli recenti che studiano l'ipergrafico LP).


6

La maggior parte delle risposte ha già affrontato il motivo principale per preoccuparsi del gap di integralità, vale a dire che un algoritmo di approssimazione basato esclusivamente sull'uso del limite fornito dal rilassamento non può sperare di dimostrare un rapporto migliore del gap di integralità. Consentitemi di fornire altri due meta motivi per cui il divario di integralità è una guida utile. Per una vasta classe di problemi di ottimizzazione combinatoria, l'equivalenza di separazione e ottimizzazione mostra che gli algoritmi esatti sono intimamente correlati allo scafo convesso delle soluzioni realizzabili per il problema. Pertanto, la prospettiva geometrica e algoritmica sono strettamente legate tra loro. Un'equivalenza formale simile non è nota per gli algoritmi di approssimazione ma è una guida utile: gli algoritmi vanno di pari passo con rilassamenti geometrici. L'innovazione algoritmica si verifica quando le persone hanno un obiettivo concreto da migliorare.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.