Complessità del circuito OR di un operatore lineare denso

Considera il seguente modello di circuito monotono semplice: ogni gate è solo un OR binario. Qual è la complessità di una funzione $f(x)=Ax$ dove $A$ è una matrice booleana $n \times n$ con $O(n)$ 0? Può essere calcolato con circuiti OR di dimensioni lineari?

Più formalmente, $f$ è una funzione da $n$ a $n$ bit. L' $i$ - uscita di $f$ è $\bigvee_{j=1}^{n}(A_{ij} \land x_j)$ (ovvero un OR del sottoinsieme di bit di input dato dalla $i$ -esima riga di $A$ ).

Si noti che $O(n)$ 0 divide le righe di $A$ in intervalli di $O(n)$ (sottoinsiemi costituiti da elementi consecutivi di $[n]$ ). Ciò consente di utilizzare strutture di dati di query di intervallo note. Ad esempio, una struttura di dati di tabella sparsa può essere trasformata in un circuito OR di dimensioni $O(n\log n)$ . L'algoritmo di Yao per le query dell'operatore del semigruppo di intervallo può essere trasformato in un circuito quasi lineare (di dimensione $O(\alpha(n) \cdot n)$ dove $\alpha(n)$ è Ackermann inverso)

In particolare, non so nemmeno come costruire un circuito di dimensioni lineari per un caso speciale in cui ogni riga di $A$ contiene esattamente due zeri. Mentre il caso di esattamente uno zero in ogni riga è facile. (Ogni funzione di uscita può essere calcolata da un OR di un prefisso $[1..k-1]$ e un suffisso $[k+1..n]$ , che può essere precompilato da $2n$ porte OR.)

ds.algorithms circuit-complexity upper-bounds

— Alexander S. Kulikov
fonte

È noto un limite superiore: è al massimo rk (A) volte n diviso per il log n, dove rk (A) è il rango OR di una matrice booleana A (= numero minimo di tutte le sottomaterie all-1 il cui OR coincide con A ). Vedi Lemma 2.5 in questo libro . Quindi, quanto può essere grande (al massimo) il rango booleano di una matrice nxn con zeri O (n)?

— Stasys,

@Stasys Grazie, Stasys! Già per la matrice con diagonale zero il grado OR è lineare, giusto?

— Alexander S. Kulikov il

Il grado OR della tua matrice (zero diagonale e 1s altrove) è al massimo 2 \ log n: etichetta righe / colonne per stringhe binarie di lunghezza \ log n e considera i rettangoli {(r, c): r (i) = a, c (i) = 1-a} per a = 0,1. Si noti inoltre che Lemma 2.5 è un limite superiore . Un limite inferiore in termini di grado OR è dato in Thm. 3.20. Inoltre, il registro del grado OR è esattamente la complessità di comunicazione non deterministica delle matrici.

— Stasys,

@Stasys oh, sì, giusto!

— Alexander S. Kulikov,

Risposte:

Questa è una risposta parziale (affermativa) nel caso in cui abbiamo un limite superiore sul numero di zeri in ogni riga o in ogni colonna.

Un rettangolo è una matrice booleana composta da una matrice secondaria all-1 e con zeri altrove. Un OR-rank di una matrice booleana è il numero più piccolo di rettangoli in modo tale che possa essere scritto come OR (per componente) di questi rettangoli. Cioè, ogni 1 voce di è 1 voce in almeno uno dei rettangoli e ogni 0 voci di è 0 voci in tutti i rettangoli. Si noti che è esattamente la complessità di comunicazione non deterministica della matrice $rk(A)$ $r$ $A$ $A$ $A$ $\log rk(A)$ $A$ (dove Alice ottiene le righe e le colonne di Bob). Come ha scritto OP, ogni matrice booleana definisce una mappatura , dove per . Cioè, prendiamo un prodotto a matrice vettoriale rispetto al seme booleano. $m\times n$ $A=(a_{i,j})$ $y=Ax$ $y_i=\bigvee_{j=1}^na_{i,j}x_j$ $i=1,\ldots,m$

Il seguente lemma è dovuto a Pudlák e Rödl; vedere la proposizione 10.1 in questo documento o Lemma 2.5 in questo libro per una costruzione diretta.

Lemma 1: per ogni matrice booleana , la mappatura può essere calcolata da un circuito OR illimitato di fanin di profondità-3 utilizzando al massimo cavi . $n\times n$ $A$ $y=Ax$ $O(rk(A)\cdot n/\log n)$

Abbiamo anche il seguente limite superiore sul rango OR delle matrici dense. L'argomento è una semplice variante di quella usata da Alon in questo documento .

Lemma 2: Se ogni colonna o ogni riga di una matrice booleana contiene al massimo zeri, allora , dove è il numero di s in . $A$ $d$ $rk(A)=O(d\ln|A|)$ $|A|$ $1$ $A$

Dimostrazione: Costruire un casuale all sottomatrice scegliendo ogni riga indipendentemente con la stessa probabilità . Lasciate che sarò il sottoinsieme casuale ottenuto di righe. Poi lasciate , dove è l'insieme di tutte le colonne di che non hanno zeri nelle righe a . $1$ $R$ $p=1/(d+1)$ $I$ $R=I\times J$ $J$ $A$ $I$

A -entry di è coperto da se è stato scelto e nessuno di (al massimo ) righe con un nella colonna esimo stato scelto in . Quindi, la voce è coperta con probabilità almeno $1$ $(i,j)$ $A$ $R$ $i$ $I$ $d$ $0$ $j$ $I$ $(i,j)$ . Se applichiamo questa procedura volte per ottenere rettangoli, la probabilità che sia coperta da nessuno di questi rettangoli non supera . Secondo il limite del sindacato, la probabilità che qualche -entry of rimanga scoperta è al massimo $p(1-p)^{d}\geq pe^{-pd-p^2d}\geq p/e$ $r$ $r$ $(i,j)$ $(1-p/e)^r\leq e^{-rp/e}$ $1$ $A$ $|A|\cdot e^{-rp/e}$ , che è inferiore a per . $1$ $r=O(d\ln|A|)$ $\Box$

Corollario: se ogni colonna o ogni riga di una matrice booleana contiene al massimo zeri, la mappatura può essere calcolata da un circuito OR illimitato di fanin di profondità 3 utilizzando fili . $A$ $d$ $y=Ax$ $O(dn)$

Immagino che un limite superiore simile a quello di Lemma 2 dovrebbe valere anche quando è il numero medio di s in una colonna (o in una riga). Sarebbe interessante mostrarlo. $d$ $1$

Osservazione: (aggiunto il 04.01.2018) Un analogo di Lemma 2 vale anche quando è il numero medio massimo di zeri in una sottostruttura di , dove il numero medio di zeri in una matrice è il numero totale di zeri diviso per . Ciò segue dal Teorema 2 in N. Eaton e V. Rödl ;, Grafici di piccola dimensione, Combinatorica 16 (1) (1996) 59-85 . Un limite superiore leggermente peggiore $rk(A)=O(d^2\log n)$ $d$ $A$ $r\times s$ $s+r$ può essere derivato direttamente da Lemma 2 come segue. $rk(A)=O(d^2\ln^2 n)$

Lemma 3: Let . Se ogni sottografo spanning di un grafico bipartito ha un grado medio , allora può essere scritto come unione , dove il grado massimo sinistro di e il grado massimo destro di sono . $d\geq 1$ $G$ $\leq d$ $G$ $G=G_1\cup G_2$ $G_1$ $G_2$ $\leq d$

Prova: induzione sul numero di vertici. I casi base e sono ovvi. Per la fase di induzione, coloreremo i bordi in blu e rosso in modo che il grado massimo nei sottografi blu e rosso sia . Prendi un vertice di grado ; tale vertice deve esistere perché anche il grado medio dell'intero grafico deve essere . Se parte della parte sinistra, allora colora tutti i bordi che ti in blu, altrimenti colora tutti questi bordi in rosso. Se rimuoviamo il vertice $n$ $n=1$ $n=2$ $\leq d$ $u$ $\leq d$ $\leq d$ $u$ $u$ $u$ allora anche il grado medio del grafico risultante è al massimo , e possiamo ipotizzare i bordi di questo grafico dall'ipotesi di induzione. $G$ $d$ $\Box$

Lemma 4: Let . Se il numero medio massimo di zeri in una matrice booleana è al massimo , allora . $d\geq 1$ $n\times n$ $A=(a_{i,j})$ $d$ $rk(A)=O(d^2\ln^2 n)$

Prova: considera il grafico bipartito con come un bordo iff . Quindi il massimo grado medio di è al massimo . Con Lemma 3, possiamo scrivere , dove il massimo grado dei vertici sulla parte sinistra di e il massimo grado dei vertici sulla parte destra di è . Permettere $n\times n$ $G$ $(i,j)$ $a_{i,j}=0$ $G$ $d$ $G=G_1\cup G_2$ $G_1$ $G_2$ $\leq d$ $A_1$ and $A_2$ be the complements of the adjacency matrices of $G_1$ and $G_2$ . Hence, $A= A_1\land A_2$ is a componentwise AND of these matrices. The maximum number of zeros in every row of $A_1$ and in every column of $A_2$ is at most $d$ . Since $rk(A)\leq rk(A_1)\cdot rk(A_2)$ , Lemma 2 yields $rk(A)=O(d^2\ln^2 n)$ . $\Box$

N.B. The following simple example (pointed by Igor Sergeev) shows that my "guess" at the end of the answer was totally wrong: if we take $d=d(A)$ to be the average number of zeros in the entire matrix $A$ (not the maximum of averages over all submatrices), then Lemma 2 can badly fail. Let $m=\sqrt{n}$ , and put an identity $m\times m$ matrix in, say left upper corner of $A$ , and fill the remaining entries by ones. Then $d(A)\leq m^2/2n < 1$ but $rk(A)\geq m$ , which is exponentially larger than $\ln|A|$ . Note, however, that the OR complexity of this matrix is very small, is $O(n)$ . So, direct arguments (not via rank) can yield much better upper bounds on the OR complexity of dense matrices.

— Stasys
fonte

Thanks a lot, Stasys! This is nice! In the meantime, Ivan Mihajlin came with another proof. I've posted it below.

— Alexander S. Kulikov

(I tried to post this as a comment to Stasys' answer above, but this text is too long for a comment, so posting it as an answer.) Ivan Mihajlin (@ivmihajlin) came up with the following construction. Similarly to Stasys' proof, it works for the case when the maximum (rather than average) number of 0’s in each row is bounded.

First, consider the case when every row contains exactly two zeros. Consider the following undirected graph: the set of vertices is $[n]$ ; two nodes $i$ and $j$ are joined by an edge, if there is a row having zeros in columns $i$ and $j$ . The graph has $n$ edges and hence it contains a cut $(L,R)$ of size at least $n/2$ . This cut splits the columns of the matrix into two parts ( $L$ and $R$ ). Let now also split the rows into two parts: the top part $T$ contains all columns that have exactly one zero in both $L$ and $R$ ; the bottom part $B$ contains all the remaining rows. What is nice about the top part of the matrix ( $T \times (L \cup R)$ ) is that it can be computed by $O(n)$ gates. For the bottom part, let’s cut all-1 columns out of it and make a recursive call. The corresponding recurrence relation is $C(n) \le an + C(n/2)$ implying $C(n)=O(n)$ .

Now, generalize it to the case of at most $d$ zeros in every row. Let $C_d(n)$ be the complexity of an $n \times (\le dn)$ matrix with at most $d$ zeros per row (if there are more than $dn$ columns, then some of them are all-1). Partition the columns into two parts $L$ and $R$ such that at least $n(1-2^{-d})$ rows (call them $T$ ) satisfy the following property: if there are exactly $d$ zeroes in a row, then not all of them belong to the same part (denote the remaining rows by $B$ ). Then make three recursive calls: $T \times L$ , $T \times R$ , and $B \times (L \cup R)$ . This gives a recurrence relation $C_d(n) \le an + 2\cdot C_{d-1}(n(1-2^{-d}))+C_d(2^{-d}n)$ . This, in turn, implies that $C_d(n) \le f(d)\cdot n$ . The function $f(d)$ is exponential, but still.

— Alexander S. Kulikov
fonte

A nice argument. But it seems to be tailor made for the case of d=2 zeros per row. What about d>2 zeros?

— Stasys

@Stasys, it is doable if I'm not mistaken. I've updated the answer.

— Alexander S. Kulikov