Spiegazione in stile Wikipedia della teoria della complessità geometrica


43

Qualcuno può fornire una spiegazione concisa dell'approccio GCT di Mulmuley comprensibile ai non esperti? Una spiegazione che sarebbe adatta per una pagina di Wikipedia sull'argomento (che al momento è stub).

Motivazione: Sto "co-leggendo" il libro di Scott Aaronson Quantum Computing da Democrito con un mio amico che è un ricercatore di teoria delle stringhe. Nella prefazione del libro, Aaronson chiama GCT "la teoria delle stringhe dell'informatica". Essendo un teorico delle stringhe, il mio amico si è emozionato per questa affermazione e mi ha chiesto che cos'è GCT. A quel punto mi vergognai vergognosamente di non avere una risposta pronta per Wikipedia per la sua domanda.


3
Forse la risposta è farne uno :). o almeno avviarlo.
Suresh Venkat,

2
Crea uno stub - non devi scrivere tutto da solo :).
Suresh Venkat,

1
@Kaveh: ovviamente non esiste una relazione diretta tra i due campi! In effetti Scott spiega persino in che senso GCT è la teoria delle stringhe di TCS (la sua è solo una meta-discussione su come le persone nel campo della fisica teorica e dell'informatica percepiscono rispettivamente quegli approcci - ovviamente per domande totalmente diverse!). Ho riportato la storia solo per spiegare cosa ha scatenato la mia domanda, non intendevo dire che i due campi sono correlati.
Alessandro Cosentino,

2
Domanda correlata: programma GCT di Mulmuley
Kaveh,

Risposte:


36

Non sono esattamente sicuro di quale livello sia adatto per l'articolo di Wikipedia (diversi articoli sembrano mirati a diversi livelli di competenza) o esattamente quello che stai cercando. Quindi, ecco una prova, ma sono aperto al feedback.

La teoria della complessità geometrica propone di studiare la complessità computazionale delle funzioni di calcolo (diciamo, polinomi) sfruttando le simmetrie intrinseche nella complessità e eventuali simmetrie aggiuntive delle funzioni studiate.

Come con molti approcci precedenti, l'obiettivo finale è quello di separare due classi di complessità dimostrando che esiste un polinomio p che assume funzioni f come ingressi (ad esempio, dai loro vettori di coefficienti) tali che p scompare su ogni funzione f C e a s y ma non svanisce su alcune funzioni g h a r dC h a r d .Ceasy,ChardpfpfCeasyghardChard

La prima idea chiave (cfr. [GCT1, GCT2]) è quella di utilizzare le simmetrie per organizzare non le funzioni stesse, ma per organizzare le proprietà ( algebro-geometriche ) di queste funzioni, come catturate da polinomi come sopra. Ciò consente l'uso della teoria della rappresentazione nel tentativo di trovare tale p . Idee simili relative alla teoria della rappresentazione e alla geometria algebrica erano state usate in precedenza nella geometria algebrica, ma per quanto ne so, non sono mai state così.pp

La seconda idea chiave (cfr. [GCT6]) è quella di trovare algoritmi combinatori (e di tempo polinomiale) per i problemi teorici di rappresentazione risultanti, e quindi decodificare questi algoritmi per mostrare che esiste una tale . Questo può essere preso nello spirito dell'uso della Programmazione lineare (un algoritmo) per dimostrare certe affermazioni puramente combinatorie.p

In effetti, [GCT6] suggerisce di ridurre i problemi teorici di rappresentazione sopra ai problemi di Programmazione Integer , mostrando quindi che gli IP risultanti sono risolti dai loro rilasci LP e infine dando algoritmi combinatori per gli LP risultanti. Le congetture in [GCT6] sono a loro volta motivate dall'ingegnerizzazione di risultati noti per i coefficienti di Littlewood-Richardson, un problema analogo ma più semplice nella teoria della rappresentazione. Nel caso dei coefficienti LR, la regola combinatoria di Littlewood-Richardson venne prima. Successivamente Berenstein e Zelevinsky [BZ] e Knutson e Tao [KT] (vedere [KT2] per una panoramica amichevole) hanno fornito un IP per i coefficienti LR. Knutson e Tao hanno anche dimostrato la congettura di saturazione, il che implica che l'IP è risolto dal suo rilassamento LP (cfr. [GCT3, BI]).

I risultati di [GCT5] mostrano che il Lemma di normalizzazione di Noether in modo esplicito equivale essenzialmente al famigerato problema aperto nella teoria della complessità della derandomizzazione black-box del test di identità polinomiale . Praticamente come questo si inserisce nel programma più ampio è che trovare una base esplicita per le funzioni che (non) svaniscono su C e a s y (in questo caso, la classe per cui il determinante è completo) potrebbe essere usato per derivare un regola combinatoria per il problema desiderato nella teoria della rappresentazione, come è accaduto in altri contesti della geometria algebrica. Un passaggio intermedio qui sarebbe quello di trovare una base per quelli ppCeasypche (non) svaniscono sulla normalizzazione di , che è per costruzione una varietà algebrica più bella - in altre parole, per derandomizzare il Lemma di normalizzazione di Noether per DET.Ceasy

Esempi di simmetrie di complessità e funzioni

Ad esempio, la complessità di una funzione - per la maggior parte delle nozioni naturali di complessità - rimane invariata se permutiamo le variabili f ( x π ( 1 ) , , x π ( n ) ) di qualche permutazione π . Quindi le permutazioni sono simmetrie della complessità stessa. Per alcune nozioni di complessità (come nella complessità del circuito algebrico) tutti i cambiamenti lineari invertibili delle variabili sono simmetrie.f(x1,,xn)f(xπ(1),,xπ(n))π

det(X)det(AXB)=det(XT)=det(X)A,Bdet(AB)=1

Alcuni progressi recenti [questa sezione è decisamente incompleta e più tecnica, ma un account completo richiederebbe decine di pagine .... Volevo solo evidenziare alcuni progressi recenti]

Burgisser e Ikenmeyer [BI2] hanno mostrato un limite inferiore sulla moltiplicazione di matrici dopo il programma GCT per quanto riguarda l'utilizzo di rappresentazioni con zero contro zero diverse. Landsberg e Ottaviani [LO] hanno dato il limite inferiore più noto essenzialmente di sul rango di confine della moltiplicazione di matrici usando la teoria della rappresentazione per organizzare le proprietà algebriche, ma non usando le moltiplicazioni di rappresentazione né le regole combinatorie.32n22n2

Il prossimo problema dopo i coefficienti di Littlewood-Richardson sono i coefficienti di Kronecker . Questi si presentano sia in una serie di problemi che si sospetta che alla fine raggiungano i problemi teorico-rappresentativi che sorgono in GCT, sia più direttamente come limiti sulle molteplicità nell'approccio GCT alla moltiplicazione di matrice e permanente rispetto a determinante. Trovare una regola combinatoria per i coefficienti di Kronecker è un problema aperto di vecchia data nella teoria della rappresentazione; Blasiak [B] ha recentemente dato una simile regola combinatoria per i coefficienti di Kronecker con una forma ad uncino.

Kumar [K] ha mostrato che certe rappresentazioni compaiono nell'anello di coordinate del determinante con molteplicità diversa da zero, assumendo la congettura quadrata latina della colonna (cfr. Huang-Rota e Alon-Tarsi; anche questa congettura, forse non a caso, si presenta in [BI2 ]). Quindi queste rappresentazioni non possono essere usate per separare il permanente dal determinante sulla base delle molteplicità zero rispetto a zero, anche se potrebbe essere ancora possibile usarli per separare il permanente dal determinante da una disuguaglianza più generale tra le molteplicità.

Riferimenti [B] J. Blasiak. Coefficienti di Kronecker per una forma ad uncino. arXiv: 1209.2018, 2012.

[BI] P. Burgisser e C. Ikenmeyer. Un algoritmo a flusso massimo per positività dei coefficienti di Littlewood-Richardson. FPSAC 2009.

[BI2] P. Burgisser e C. Ikenmeyer. Limiti espliciti inferiori tramite la teoria della complessità geometrica. arXiv: 1210.8368, 2012.

[BZ] AD Berenstein e AV Zelevinsky. Triplicità per e lo spettro dell'algebra esterna della rappresentazione aggiunta. sl(r+1)J. Algebraic Combin. 1 (1992), n. 1, 7–22.

[GCT1] KD Mulmuley e M. Sohoni. Teoria della complessità geometrica I: un approccio alla P vs. NP e problemi correlati. SIAM J. Comput. 31 (2), 496-526, 2001.

[GCT2] KD Mulmuley e M. Sohoni. Teoria della complessità geometrica II: verso ostacoli espliciti per matrimoni tra varietà di classe. SIAM J. Comput., 38 (3), 1175–1206, 2008.

[GCT3] KD Mulmuley, H. Narayanan e M. Sohoni. Teoria della complessità geometrica III: sulla decisione di non levigare un coefficiente di Littlewood-Richardson. J. Algebraic Combin. 36 (2012), n. 1, 103–110.

[GCT5] KD Mulmuley. Teoria della complessità geometrica V: Equivalenza tra derandomizzazione blackbox del test di identità polinomiale e derandomizzazione del Lemma di normalizzazione di Noether. FOCS 2012, anche arXiv: 1209.5993.

[GCT6] KD Mulmuley. Teoria della complessità geometrica VI: il capovolgimento tramite positività. , Rapporto tecnico, dipartimento di informatica, Università di Chicago, gennaio 2011.

[K] S. Kumar. Uno studio delle rappresentazioni supportate dalla chiusura dell'orbita del determinante. arXiv: 1109.5996, 2011.

[LO] JM Landsberg e G. Ottaviani. Nuovi limiti inferiori per il grado di confine della moltiplicazione di matrici. arXiv: 1112.6007, 2011.

[KT] A. Knutson e T. Tao. Il modello a nido d'ape dei prodotti tensoriali . I. Prova della congettura di saturazione. GLn(C)J. Amer. Matematica. Soc. 12 (1999), n. 4, 1055-1090.

[KT2] A. Knutson e T. Tao. Favi e somme di matrici eremitiche. Avvisi Amer. Matematica. Soc. 48 (2001), n. 2, 175–186.


7
Per quanto riguarda la frase di apertura su quale livello è adatto a Wikipedia: la risposta breve è il più semplice possibile, ma non più semplice. L'inizio di un articolo di Wikipedia, in particolare, dovrebbe essere scritto per un pubblico il più vasto possibile (senza fare un hash dell'argomento); le parti successive possono diventare più tecniche. Per maggiori dettagli consultare la guida di Wikipedia en.wikipedia.org/wiki/WP:TECHNICAL (E forse dovrebbe essere ovvio che non tutti gli articoli riescono a raggiungere questi obiettivi.)
David Eppstein,

4
Una buona idea potrebbe puntare a un livello simile a en.wikipedia.org/wiki/Representation_theory che inizia in qualche modo delicatamente ma poi diventa molto più tecnico.
Mugizi Rwebangira,

2
Stavo cercando una spiegazione comprensibile per i non esperti in CS, che sono ancora scienziati in qualche altro campo (la fisica in particolare). La tua risposta soddisfa perfettamente questo requisito. Grazie!
Alessandro Cosentino,

1
Perché non aggiungere questo alla pagina di Wikipedia?
Saadtaame,

2

Di recente ho dato una risposta a una domanda correlata su Mathoverflow https://mathoverflow.net/questions/277408/what-are-the-current-breakthroughs-of-geometric-complexity-theory

Poiché questo sito è forse un luogo migliore, vorrei semplicemente ripetere la risposta di seguito. I riferimenti a Joseph o Timothy riguardano gli altri post per quella domanda MO.


Sia una matrice generica e il grado polinomio omogeneo dato da il determinante. Lascia che che prende il permanente di una sottomatrice e si moltiplica per la sua forma lineare preferita per creare un altro polinomio omogeneo di grado (si potrebbe anche usare la voce invece di ). Questa modifica si chiama imbottitura . Quindi definire il numero X=(Xij)1i,jnn×nF1(X)=det(X)n

F2(X)=(Xnn)nm×perm[(Xij)1i,jm]
m×mnX11Xnn
c(m)=min{ n | nm  and  GF2¯GF1¯ }
dove è agisce sullo spazio affine della dimensione dove vive e sono chiusure di orbite di Zariski. La grande congettura nell'area o l'ipotesi di Valiant (una versione complessa di ) è che cresce più velocemente di qualsiasi polinomio in .GGL(n2)n2XGFi¯PNPc(m)m

Ora se , allora si ha una surrogativa -equivariant map tra gradi parti degli anelli di coordinate di queste chiusure dell'orbita. Quindi il gioco è provare a dimostrare che ciò non accade, per insufficientemente rispetto a , dimostrando l'esistenza di un ostacolo alla molteplicità , ovvero una rappresentazione irriducibile per la quale le molteplicità soddisfano GF2¯GF1¯G

C[GF1¯]dC[GF2¯]d
dnmλ
multλ(C[GF1¯]d)<multλ(C[GF2¯]d)
o a livello di ideali
multλ(I[GF1¯]d)>multλ(I[GF2¯]d) .

Un approccio ottimista è cercare di mostrare che esistono ostacoli all'occorrenza , ad esempio, è tale che e . Questa speranza è stata schiacciata nel lavoro di Bürgisser, Ikenmeyer e Panova citati da Timothy. Tuttavia, la possibilità di ostacoli alla molteplicità è ancora aperta.λmultλ(C[GF1¯]d)=0multλ(C[GF2¯]d)>0

Penso che l'approccio di Mulmuley sia di provare a provare l'esistenza di tali ostacoli alla molteplicità sfruttando tutti gli strumenti disponibili dalla teoria della rappresentazione per il calcolo di queste molteplicità. Personalmente, non sono mai stato un fan di questo approccio. Avendo studiato a fondo la teoria invariante del XIX secolo, mi sembra più naturale affrontare il problema della separazione delle orbite usando gli strumenti espliciti di quell'epoca. Questo articolo di Gorchow sembra puntare anche in una direzione simile (sospetto che il terzo articolo menzionato da Joseph sia nella stessa vena). Nel linguaggio classico (vedi Turnbull o Littlewood ), si deve costruire esplicitamente un concomitante misto che svanisce suF1ma non su . Bisogna anche farlo infinitamente spesso (in ) per stabilire la proprietà di crescita superpolinomiale. Tale concomitante è la stessa di una specifica mappa equivalente dal tuo modello preferito per la rappresentazione irriducibile all'algebra polinomiale nelle variabili (Grochow lo chiama un modulo di separazione ). I teorici invarianti del XIX secolo avevano due metodi per generare tali oggetti: la teoria dell'eliminazione e l' algebra schematica .F2mGλn2X

Un esempio molto piccolo in cui e sono forme quartiche binarie sotto l'azione di (vedi questa domanda MO ) è dire e Un concomitante separatore (qui in effetti un covariante) è l'Assia di un generico quartico binario Svanisce (identicamente in ) per ma non perF1F2G=SL(2)

F1(x,y)=x4+8x3y+24x2y2+32xy3+16y4
F2(x,y)=16x424x3y+12x2y22xy3 .
F
H(F)(x,y)=2Fx22Fy2(2Fxy)2 .
x,yF=F1F=F2. In questo caso, l'Assia può essere vista come una mappa equivariante dal irriducibile dato dal secondo potere simmetrico (della rappresentazione bidimensionale fondamentale) nell'anello di coordinate per lo spazio affine dei quartici binari.

Quindi un possibile "piano" superottimistico per GCT prevede la seguente sequenza di passaggi.

1) Trova un modo per generare tonnellate di concomitanti.

2) Identificare alcuni candidati espliciti per la sparizione su e dimostrare quella proprietà.F1

3) Mostra che non svaniscono su .F2

Il passaggio 1) è in linea di principio risolto dal primo teorema fondamentale per ma esiste una discrepanza: il determinante è un oggetto naturale nella teoria invariante per (che agisce su file e colonne) anziché . Si potrebbe provare a riparare la mancata corrispondenza esprimendo il blocco di base per la teoria invariante di in termini di quella per (vedere questa domanda MO per un problema di riduzione simile da a ).GL(n2)GL(n)×GL(n)GL(n2)GL(n2)GL(n)×GL(n)SL(n(n+1)/2)SL(n)

Indovinare i candidati giusti per il passaggio 2) mi sembra difficile. Sapere in anticipo che alcune molteplicità sono diverse da zero sarebbe sicuramente di aiuto. Tuttavia, si potrebbe procrastinare e rinviare la prova della sparizione non identica del concomitante al passaggio 3) che dovrebbe mostrare comunque più di questo. Se uno ha tali candidati giusti, mostrare che svaniscono su potrebbe essere facile per argomenti che si potrebbero chiamare il principio di esclusione di Pauli (contrarre le simmetrizzazioni con antisimmetretrizzazioni), un'elevata proprietà numerica cromatica o semplicemente la "mancanza di spazio".multλ(I[GF1¯]d)F1

Tuttavia, penso che la parte più difficile sia il passaggio 3). Ad esempio, nel mio articolo "16.051 formule per l'invariante di tre cubi di Ottaviani" con Ikenmeyer e Royle, la supposizione è stata fatta dalla ricerca al computer, ma con il candidato giusto in mano, la sparizione su stata relativamente facile da spiegare (è piuttosto un bell'esempio di numero cromatico dovuto alle proprietà globali del grafico piuttosto che a una grande cricca). L'analogo del passaggio 3) nel nostro articolo è stato fatto con il calcolo del computer a forza bruta e non abbiamo ancora idea del perché sia ​​vero. Il problema paradigmatico relativo al passaggio 3) è la congettura Alon-Tarsi (vedi questa domanda MO e questaF1pure). A mio avviso, è necessario compiere progressi su questo tipo di domanda (anche il Teorema dei quattro colori è di questo tipo, attraverso una riduzione dovuta a Kauffman e Bar-Natan) prima della congettura di Valiant.

Poiché la domanda riguarda le scoperte nel GCT. Penso che questo articolo di Landsberg e Ressayre meriti anche qualche attenzione poiché suggerisce che un'ipotesi ragionevole per il valore esatto di sia Si noti che una prova del concetto per l'approccio esplicito "Passaggio 1), 2), 3)", su un problema molto più semplice, è stato fornito da Bürgisser e Ikenmeyer in questo articolo . Infine, per ulteriori informazioni su GCT, consiglio vivamente la recensione "Teoria della complessità geometrica: un'introduzione per i geometri" di Landsberg.c(m)

(2mm)1 .

PS: Dovrei aggiungere che il mio pessimismo è specifico per l'ipotesi valorosa che è l'ipotesi di Riemann sul campo. Naturalmente, non si dovrebbe gettare il bambino con l'acqua del bagno e denigrare GCT perché finora non è riuscito a provare questa congettura. Ci sono molti problemi più accessibili in questo settore in cui sono stati compiuti progressi e sono previsti ulteriori progressi. Vedi in particolare l'articolo sopra citato di Grochow e la recensione di Landsberg.


-4

GCT è un programma di ricerca per dimostrare i limiti della teoria della complessità e in qualche modo sfida un sommario / sommario in stile wikipedia a causa della sua pesante astrazione, ma per la folla TCS sono disponibili buoni sondaggi. [2] [3] [4] (e sicuramente Wikipedia è il posto migliore per le voci di Wikipedia). è stato formulato nei primi anni 2000 da Mulmuley ed è sia relativamente nuovo nella teoria della complessità sia molto avanzato, usando e applicando matematica avanzata (geometria algebrica) che non ha avuto origine nella teoria TCS / complessità.

l'approccio è considerato promettente da alcuni ma forse troppo complesso da altre autorità, cioè non è dimostrato e quindi controverso se possa superare le "barriere" standard note. (in questo senso mostra alcuni segni di un cosiddetto "cambio di paradigma" kuhniano). Anche Mulmuley propone che realisticamente potrebbe non riuscire (nel dimostrare le principali separazioni della classe di complessità) dopo decenni di ulteriore sviluppo. ecco un'opinione scettica di Fortnow, un'autorità leader nel campo della teoria della complessità: [1]

Prendi in considerazione un'enorme montagna e vuoi raggiungere la cima della montagna. Ketan arriva e dice che ti insegnerà come creare gli strumenti necessari per scalare la montagna. Ci vorrà un duro mese di studio e in realtà questi strumenti non sono abbastanza buoni per scalare la montagna. Devono essere migliorati e questi miglioramenti non accadranno durante la tua vita. Ma non vuoi imparare come gli altri scaleranno la montagna tra secoli?

[1] Come dimostrare NP diverso dal blog P Fortnow

[2] Comprensione dell'approccio Mulmuley-Sohoni a P vs. NP Regan

[3] Su P contro NP e teoria della complessità geometrica Mulmuley

[4] Il programma GCT verso il problema P vs. NP Mulmuley


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.