Spiega l'interpretazione di grado tensore di Gurvits del documento di Deolalikar


20

[Nota: credo che questa domanda non dipenda in alcun modo dalla correttezza o dall'inesattezza del documento di Deolalikar.]

Sul blog di Scott Aaronson Shtetl Optimized , nella discussione sul recente tentativo di Deolalikar su P vs NP, Leonid Gurvits ha fatto il seguente commento :

Ho cercato di capire / riformulare l'approccio, ed ecco il mio, forse molto minimalista, tentativo: le discrete distribuzioni probabilistiche nel documento possono essere viste come tensori o polinomi multilineari molto speciali. Le assunzioni "P = NP" danno in qualche modo un limite superiore (polinomiale?) Al rango di tensore. E infine, usando risultati probabilistici noti, ottiene un limite inferiore (esponenziale?) Non corrispondente sullo stesso rango. Se ho ragione, allora questo approah è un modo molto intelligente, in un certo senso elementare, di spingere i precedenti approcci algebrici-geometrici.

Nonostante i sospetti / noti difetti nella dimostrazione di Deolalikar, sono curioso:

In che modo le distribuzioni discusse nell'articolo di Deolalikar possono essere considerate come tensori, e in che modo le dichiarazioni dei suoi risultati (indipendentemente dalla loro correttezza) si traducono in dichiarazioni sul rango di tensore?


Ho appena visto questo. Perché non chiedere a Gurvits stesso? ...
Ryan Williams,

1
@Ryan: l'ho fatto :). Ha risposto rapidamente che è impegnato in questo momento, ma alla fine ci riuscirà sicuramente. È passato un po 'di tempo e speravo che qualcuno qui potesse essere in grado di chiarire l'osservazione più velocemente.
Joshua Grochow,

Risposte:


10

[Stavo leggendo qualcosa che pensavo fosse totalmente estraneo e poi ho avuto un "momento aha", quindi penso di aver capito almeno parte della risposta. Non sono sicuro se questo è ciò che Gurvits aveva in mente, ma questo ha senso per me.]

Una distribuzione su n variabili binarie può essere vista come un elemento del prodotto tensore (n fattori) ( in realtà lo spazio proiettivo associato, ma ci arriveremo). Se etichettiamo gli elementi base di ogni copia di per ex1,...,xnR2R2R2|0|1, quindi una base di questo spazio prodotto tensore è data dall'insieme di tutte le stringhe n-bit. Se abbiamo un elemento di questo prodotto tensore i cui coefficienti sono pari a 1, allora possiamo interpretare il coefficiente di una data stringa n-bit come la probabilità che si verifichi quella stringa - da cui una distribuzione di probabilità! Ora, poiché vogliamo solo distribuzioni di probabilità (coefficienti che sommano a 1), possiamo normalizzare qualsiasi vettore nel prodotto tensore per avere quella proprietà. Considerando solo i tensori normalizzati, stiamo davvero prendendo in considerazione solo gli elementi dello spazio proiettivo di questo prodotto tensore.

Ora dobbiamo collegare il rango di tensore alla nozione di paramolizzabilità del polilogo di Deolalikar. Secondo questa pagina di Terry Tao, sembra che l'idea di Deolalikar di parametrizzabilità dei poliloghi sia che la distribuzione può essere "fattorizzata in potenziali" come dove pa (i) è un insieme di variabili di polilogo (n), definite come i "genitori di i" e è una distribuzione su che dipende solo da queste variabili parent. Inoltre, il grafico diretto dei genitori dovrebbe essere aciclico.μμ(x1,...,xn)=i=1npi(xi;xpa(i))pi(;xpa(i))xi

Cominciamo con un tipo di distribuzione molto semplice. Supponiamo che soddisfi per alcune distribuzioni (dove dipende solo da ). Quindi è chiaro che il tensore corrispondente è il tensore di grado 1: .μμ(x1,...,xn)=i=1npi(xi)pipixi(p1(0)|0+p1(1)|1)(pn(0)|0+pn(1)|1)

Per una distribuzione leggermente più complicata, supponiamo di voler considerare la distribuzione uniforme sulle stringhe in cui (sono la negazione reciproca) per tutti . Nell'interpretazione di Tao del linguaggio di Deolalikar, questa sarebbe una distribuzione parametrizzabile . Quindi questo corrisponde al tensore (deve essere normalizzato). Se lo scriviamo per intero, contiene termini e quindi ha un grado tensore al massimo di su . Tuttavia, finitax2i=1x2i+1iO(1)(|0|1+|1|0)(|0|1+|1|0)2n/22n/2R2R2R2 , ha il grado tensore 1! Credo che quest'ultimo fatto corrisponda al fatto che la fattorizzazione può essere descritta da numeri - per ciascuna coppia di bit adiacenti, per ciascuna delle coppie adiacenti . Significativamente più piccolo dei numeri reali richiesti in teoria per un mu di distribuzione arbitraria sul cubo booleano.O(n)O(1)O(n)2n

Ho ancora problemi a formulare due problemi e apprezzerei ulteriori risposte su di essi:

  • Rendere precisa quest'ultima corrispondenza
  • Scrivere le formule per il tensore che corrispondono alla distribuzione parametrizzabile polilogo e ottenere un limite superiore nel suo rango.

sei mai tornato a questo?
T ....
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.