"Dove sono i problemi davvero difficili" ha resistito? Quali sono le idee attuali in materia?


27

Ho trovato questo documento molto interessante. Riassumendo: si discute perché nella pratica raramente si trova un'istanza nel caso peggiore di un problema NP-completo. L'idea nell'articolo è che le istanze di solito sono molto poco o troppo vincolate, entrambe relativamente facili da risolvere. Propone quindi per alcuni problemi una misura di "costrizione". Questi problemi sembrano avere una "transizione di fase" dalla probabilità 0 di una soluzione alla probabilità del 100%. Quindi ipotizza:

  1. Che tutti i problemi NP-completi (o anche tutti i problemi NP) hanno una misura di "costrizione".
  2. Questo per ogni problema NP completo, è possibile creare un grafico della probabilità che una soluzione esista in funzione della "costrizione". Inoltre, quel grafico conterrà una transizione di fase in cui tale probabilità aumenta rapidamente e in modo drammatico.
  3. Gli esempi peggiori dei problemi NP-completi si trovano in quella transizione di fase.
  4. Il fatto che un problema risieda in tale transizione di fase rimane invariante quando si trasforma un problema NP completo in un altro.

Questo documento è stato pubblicato nel 1991. La mia domanda è stata una ricerca di follow-up su queste idee negli ultimi 25 anni? E se è così, che cosa sta pensando l'attuale mainstream su di loro? Sono stati trovati corretti, errati, irrilevanti?


Istanze casuali di CSP, k-sat, k-colorazione sono state ampiamente studiate dalla comunità TCS. Ad esempio, il fatto che la densità / "costrizione" alla quale possiamo risolvere efficacemente un particolare problema sia spesso inferiore alla soglia alla quale la probabilità di una soluzione esistente va da 1 a 0 whp ha attirato molta attenzione.
JWM,

Con quale probabilità si trova la soglia della "facile solvibilità" (in termini approssimativi)? È più simile a 0,2 o più come 0,001?
Dimpol

1
@dimpol di solito non viene definita una soglia così precisa. Il punto è a quale "vincolo" la probabilità va a 0 o 1 con la dimensione di input. Una tipica affermazione sarebbe: "L'algoritmo A risolve un'istanza casuale 3-SAT con variabili e clausole Δ n con probabilità almeno p n , dove p n va a 1 con n ." La soglia è il valore di Δ per il quale la probabilità va da tendente a 0 a tendente a 1.nΔnpnpnnΔ
Sasho Nikolov

penso che le idee siano state molto influenti in generale e che ci sia una serie molto ampia di articoli relativi a questo argomento e la ricerca continua. tuttavia, è un concetto trasversale perché le transizioni di fase derivano maggiormente dalla fisica e (con riferimento alla risposta di MATs di seguito) forse gli scienziati informatici sono un po 'più scettici sul loro significato, e sembra anche più un concetto empirico / sperimentale. potrebbe provare a trovare una risposta in alcuni punti se altri sono d'accordo con questo commento, ma per ora invita / vorrebbe incoraggiare fortemente ulteriori discussioni / analisi nella
Teorical

1
vedere anche quanto è comune la transizione di fase nei problemi completi NP . penso anche che Walsh 1998 il limite della lama della costrizione sia significativo e non sia stato seguito molto, è correlato al punto di transizione ma forse non esattamente lo stesso concetto ... il documento non menziona direttamente i frattali ma pensa che sia altamente suggestivo nel suo riferimento a auto-somiglianza, invarianza di scala ecc.
vzn

Risposte:


26

Ecco un breve riassunto dello stato basato su una presentazione di Vardi in un seminario sulla teoria dei modelli finiti e algoritmici (2012):

È stato osservato che casi difficili risiedono nella transizione di fase da una regione sottoposta a vincolo eccessivo. La congettura fondamentale è che esiste una forte connessione tra le transizioni di fase e la complessità computazionale dei problemi NP.

PNPP

L'attuale pensiero mainstream sembra essere (come affermato da Vardi) che le transizioni di fase non sono intrinsecamente connesse alla complessità computazionale.

Infine, ecco un articolo pubblicato su Nature che indaga la connessione tra transizioni di fase e durezza computazionale di K-SAT.


Grazie per la visione d'insieme, peccato che ciò non abbia portato a veri e propri progressi.
Dimpol

1
Penso che si possano considerare fenomeni di frantumazione per escludere una classe di algoritmi basati sulla ricerca locale che sono la base di molti algoritmi euristici per problemi NP-difficili.
Kaveh,

3
discorso / video simile / in qualche modo rivisto di Vardi, 2014, transizioni di fase e complessità computazionale , stazione di ricerca internazionale Banff
vzn

@vzn Nice, deve guardare il video di Vardi.
Mohammad Al-Turkistany,

14

Sì, c'è stato molto lavoro dai lavori di Cheeseman, Kanefsky e Taylor del 1991.

Fare una ricerca per recensioni di transizioni di fase di problemi NP-Complete ti darà molti risultati. Una di queste recensioni è Hartmann e Weigt [1]. Per un livello più alto di introduzione, vedi articoli di scienziato americano Brian Hayes [2] [3].

L'articolo di Cheesemen, Kanefsky e Taylor del 1991 è uno sfortunato caso di scienziati informatici che non prestano attenzione alla letteratura matematica. In Cheeseman, Kanefsky e Taylor, hanno identificato il ciclo hamiltoniano con una transizione di fase con un aumento dei costi di ricerca vicino alla soglia critica. Il modello di grafico casuale che hanno usato era il grafico casuale di Erdos-Renyi (probabilità del bordo fisso o distribuzione gradi gaussiana equivalente). Questo caso è stato ben studiato prima della pubblicazione di Cheeseman e di tutti del 1991 con noti algoritmi polinomiali del tempo quasi sicuri per questa classe di grafici, anche alla soglia critica o vicino. "Random Graphs" [4] di Bollobas è un buon riferimento. La prova originale credo sia stata presentata da Angliun e Valiant [5] con ulteriori miglioramenti da Bollobas, Fenner e Frieze [6]. Dopo Cheeseman,

La transizione di fase per i cicli hamiltoniani nei grafici casuali Erdos-Renyi esiste nel senso che esiste una rapida transizione della probabilità di trovare una soluzione, ma ciò non si traduce in un aumento della complessità "intrinseca" della ricerca di cicli hamiltoniani. Esistono algoritmi temporali polinomiali quasi sicuri per trovare i cicli hamiltoniani nei grafici casuali Erdos-Renyi, anche durante la transizione critica, sia in teoria che in pratica.

La propagazione dei sondaggi [8] ha avuto un buon successo nel trovare casi soddisfacenti per 3-SAT casuali molto vicino alla soglia critica. Le mie attuali conoscenze sono un po 'arrugginite, quindi non sono sicuro che ci siano stati grandi progressi nella ricerca di algoritmi "efficienti" per casi insoddisfacenti vicino alla soglia critica. 3-SAT, per quanto ne so, è uno dei casi in cui è "facile" da risolvere se è soddisfacente e vicino alla soglia critica ma sconosciuto (o difficile?) Nel caso insoddisfacente vicino alla soglia critica.

La mia conoscenza è un po 'datata ora, ma l'ultima volta che ho approfondito questo argomento, c'erano alcune cose che mi hanno colpito:

  • Il ciclo hamiltoniano è "facile" per i grafici casuali Erdos-Renyi. Dove sono i problemi difficili per questo?
  • La partizione numerica dovrebbe essere risolvibile quando molto lontano nella regione di probabilità 0 o 1 quasi certa ma non esistono algoritmi efficienti (per quanto ne sappia) per dimensioni anche di istanze moderate (1000 numeri di 500 bit ciascuno sono, per quanto ne so, completamente intrattabili con algoritmi all'avanguardia). [9] [10]
  • 3-SAT è "facile" per istanze soddisfacenti vicino alla soglia critica, anche per dimensioni di istanze enormi (milioni di variabili) ma difficile per istanze insoddisfacenti vicino alla soglia critica.

Esito a includerlo qui poiché non ho pubblicato alcun documento peer-review, ma ho scritto la mia tesia questo proposito. L'idea principale è che una possibile classe di ensemble casuali (cicli di Hamiltonian, problemi di partizione numerica, ecc.) Che sono "intrinsecamente difficili" sono quelli che hanno una proprietà di "invarianza di scala". Le distribuzioni Levy-stabile sono una delle distribuzioni più naturali con questa qualità, con code di legge di potere, e si possono scegliere istanze casuali da insiemi NP-Complete che in qualche modo incorporano la distribuzione Levy-stabile. Ho dato alcune prove deboli che si possono trovare istanze del ciclo hamiltoniano intrinsecamente difficili se si scelgono grafici casuali con una distribuzione in gradi stabile di Levy anziché una distribuzione normale (cioè Erdos-Renyi). Se non altro ti darà almeno un punto di partenza per qualche revisione della letteratura.

[1] AK Hartmann e M. Weigt. Transizioni di fase nei problemi di ottimizzazione combinatoria: basi, algoritmi e meccanica statistica. Wiley-VCH, 2005.

[2] B. Hayes. Il problema più semplice. American Scientist, 90 (2), 2002.

[3] B. Hayes. Sulla soglia American Scientist, 91 (1), 2003.

[4] B. Bollobás. Grafici casuali, seconda edizione. Cambridge University Press, New York, 2001.

[5] D. Angluin e LG Valiant. Algoritmi probabilistici veloci per circuiti e corrispondenze Hamilton. J. Computer, Syst. Sci., 18: 155–193, 1979.

[6] B. Bollobás, TI Fenner e AM Frieze. Un algoritmo per trovare percorsi e cicli di Hamilton in grafici casuali. Combinatorica, 7: 327–341, 1987.

[7] B. Vandegriend e J. Culberson. La transizione di fase G n, m non è difficile per il problema del ciclo hamiltoniano. J. of AI Research, 9: 219-245, 1998.

[8] A. Braunstein, M. Mézard e R. Zecchina. Propagazione del sondaggio: un algoritmo per la soddisfazione. Strutture casuali e algoritmi, 27: 201–226, 2005.

[9] I. Gent e T. Walsh. Analisi euristica per il partizionamento dei numeri. Intelligenza computazionale, 14: 430–451, 1998.

[10] CP Schnorr e M. Euchner. Riduzione della base reticolare: algoritmi pratici migliorati e risoluzione dei problemi di somma dei sottogruppi. In Proceedings of Fundamentals of Computation Theory '91, L. Budach, ed., Appunti di lezione di Informatica, volume 529, pagine 68–85, 1991.


0

25 anni di studio e dove sono le idee attuali:

+++ idea 1:

Nella mia esperienza nella risoluzione di soddisfazioni, ho scoperto in pratica che l'aggiunta di una clausola k valida a una formula che stiamo cercando di risolvere è simile alla decisione di una variabile (nk) qbf.

Questo sembra essere un approccio per mostrare gli attuali metodi di risoluzione sat per NP sono difficili da pspace!

+++ idea 2:

Un'altra idea è che il problema di AllQBFs sia un problema reale nella gerarchia booleana. Il problema di AllQBFs è: produrre un'espressione booleana Q che decide tutti i 2 ^ n qbfs di una formula R. AllQBFs è facile quando la formula originale R è monotona o 2-cnf.

Tutti i QBF sembrano una strada plausibile per mostrare QBF è Exp, perché Q è spesso esponenziale, quindi valutare un'assegnazione di Q (una quantificazione della formula originale R) è esponenziale. Quindi la strada per dimostrare che NP è Exp ha almeno un paio di mattoni.

+++ idea 3: k-cnfs regolari

A proposito, tutti gli studi di transizione di fase hanno mancato i k-cnfs regolari, in cui il numero di occorrenze di una variabile (in entrambe le direzioni) è fisso, simile ai grafici regolari dei gradi ... I k-cnf regolari diventano molto più difficili del modello standard, perché tutte le variabili sembrano identiche in termini di vincoli su di esse.

Venticinque anni fa, subito dopo aver letto il casaro, mi sono concentrato sulla colorazione dei grafici in gradi regolari, perché tutte le variabili sembrano uguali. Quindi abuserò del mio privilegio di risposta qui e presenterò venticinque anni di risultati su grafici regolari!

+++ idea 4: punti d'oro per studi di benchmark di soddisfacibilità

Ho studiato la colorazione C dei grafici di vertici N regolari D abbastanza ampiamente. Nella tabella seguente sono riepilogati i risultati del Punto d'oro per la normale colorazione del grafico.

Per alta probabilità, N casi casuali erano soddisfacenti. Per Very High, N ^ 2 era soddisfacente. Per Super High, N ^ 3 casi casuali erano soddisfacenti.

I punti da colorare dorati Alta probabilità (1 - 1 / N) sono:

C3D5N180 C4D6N18 C4D7N35 C4D8N60 C4D9N180? C5D10N25 C5D11N42 C5D12N72

I punti da colorare dorati della probabilità molto alta (1 - 1 / (N ^ 2)) sono:

C3D5N230? C4D6N18 C4D7N36 C4D8N68 C4D9N ??? C5D10N32 C5D11N50 C5D12N78

I punti di colorazione d'oro Super High Probability (1 - 1 / (N ^ 3)) sono:

C3D5N ??? C4D6N22 C4D7N58 C4D8N72? C4D9N ??? C5D10N38 C5D11N58 C5D12N ??

La voce C4D9 indica quattro colorazioni dei grafici di nono grado. Questi sono i 4cnfs casuali più difficili che abbia mai incontrato in 25 anni di risoluzione sat. Di recente ho colorato un grafico di nona laurea di 172 vertici dopo dieci giorni di CPU.

+++ Idea 5: C5D16N ???? Golden Point è leggermente ipotizzato che esista.

Grazie, Daniel Pehoushek


4
Questo non è il posto giusto per presentare ricerche inedite. Scrivi un documento che spiega tutto in dettaglio, mettilo su arxiv o altrove e pubblica un link qui con un riepilogo.
Sasho Nikolov,

Il punto di colorazione del grafico regolare C4D9 è un punto difficile estremo, come da titolo nella domanda. Aveva bisogno di un piccolo contesto, quindi il resto del tavolo.
daniel pehoushek,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.