Dimensione VC dei polinomi rispetto alle semenze tropicali?


14

Come in questa domanda, sono interessato al problema B P PBPP vs. PP / p o l y per i circuiti tropicali ( max , + ) e ( min , + ) . Questa domanda si riduce a mostrare i limiti superiori per la dimensione VC dei polinomi rispetto alle semirazioni tropicali (vedere Teorema 2 di seguito). poly (max,+)(min,+)

Sia R un semiring. Un modello zero di una sequenza ( f 1 , , f m ) di m polinomi in R [ x 1 , , x n ] è un sottoinsieme S { 1 , , m } per il quale esiste x R n e y R tale che per tutti i = 1 , ...R(f1,,fm)mR[x1,,xn]S{1,,m}xRnyR , mi=1,,m , f i ( x ) = y sse i S . Cioè, i grafici di esattamente quei polinomi f i con i S devono colpire il punto ( x , y ) R n + 1 . ("Zero-pattern" perché la condizione f i ( x ) = y può essere sostituita da f i ( x ) - y = 0. ) Letfi(x)=yiSfiiS(x,y)Rn+1fi(x)=yfi(x)y=0 Z ( m ) = il numero massimo possibile di schemi zero di una sequenza di m polinomi di grado al massimo d . Quindi, 0 Z ( m ) 2 m . La dimensionediVapnik-Chervonenkisdeipolinomidi grado d è V C ( n , d ) : = max { m : Z ( m ) = 2 m } . Z(m)md0Z(m)2mdVC(n,d):=max{m:Z(m)=2m}

Nota: di solito, la dimensione VC è definita per una famiglia F di insiemi come la cardinalità più grande | S | di un insieme S tale che { F S : F F } = 2 S . Per adattarci a questo frame, possiamo associare ad ogni coppia ( x , y ) R n + 1 l'insieme F x , y di tutti i polinomi di grado f d per cui f (F|S|S{FS:FF}=2S(x,y)Rn+1Fx,yfd x ) = y tiene. Quindi la dimensione VC della famiglia F di tutti questi insiemi F x , y è esattamente V C ( n , d ) . f(x)=yFFx,yVC(n,d)

Un limite superiore banale su m = V C ( n , d ) è m n log | R | (abbiamo bisogno di almeno 2 m di vettori distinti x R n per avere tutti i modelli di 2 m possibili), ma è inutile in semirimorchi infiniti. Per avere buoni limiti superiori sulla dimensione VC, abbiamo bisogno di buoni limiti superiori su Z ( m ) . Sui campi sono noti tali limiti.m=VC(n,d)mnlog|R|2mxRn2mZ(m)

Teorema 1: Su ogni campo R , abbiamo Z ( m ) ( m d + nRn )Z(m)(md+nn) .
Simili limiti superiori erano stati precedentemente dimostrati da Milnor , Heintz e Warren ; le loro prove usano tecniche pesanti dalla vera geometria algebrica. Al contrario, una dimostrazione di mezza pagina del Teorema 1 di Ronyai, Babai e Ganapathy (che diamo di seguito) è una semplice applicazione dell'algebra lineare.

Cercando piccole m 'soddisfacenti ( m d + nmn)<2m(md+nn)<2m, we obtain that VC(n,d)=O(nlogd)VC(n,d)=O(nlogd) holds over any field. In view of the BPPBPP vs. PP/polypoly, important here is that the dimension is only logarithmic in the degree dd. This is important because circuits of polynomial size can compute polynomials of exponential degree, and because a result of Haussler in PAC learning (Corollary 2 on page 114 of questo documento ) fornisce quanto segue (laddove ipotizziamo che i circuiti deterministici possano utilizzare il voto di maggioranza per produrre i loro valori).

Teorema 2: B P PP / p o l y vale per i circuiti su qualsiasi semiringa R , dove V C ( n , d ) è solo polinomiale in n e log d . BPPP/polyRVC(n,d)nlogd
Vedi qui su come il risultato di Haussler implica il Teorema 2.

In particular, by Theorem 1, BPPP/polyBPPP/poly holds over any field. (Interesting is here only the case of infinite fields: for finite ones, much simpler arguments work: Chernoff bound then does the work.) But what about (infinite) semirings that are not fields, or even not rings? Motivated by dynamic programming, I am mainly interested in tropical (max,+)(max,+) and (min,+)(min,+) semirings, but other "non-field" (infinite) semirings are interesting as well. Note that, over the (max,+)(max,+) semiring, a polynomial f(x)=aAcani=1xaiif(x)=aAcani=1xaii with ANAN and caRcaR, turns into the maximization problem f(x)=maxaA {ca+a1x1+a2x2++anxn}f(x)=maxaA {ca+a1x1+a2x2++anxn}; the degree of ff is (as customary) the maximum of a1++ana1++an over all aAaA.

Question : Is the VC dimension of degree dd polynomials over tropical semirings polynomial in nlogdnlogd?

I admit, this can be a rather hard question to expect a quick answer: tropical algebra is rather "crazy". But perhaps somebody has some ideas on why (if any) tropical polynomials could produce more zero-patterns than real polynomials? Or why they "shouldn't"? Or some related references.

Or, perhaps, the proof of Babai, Ronyai, and Ganapathy (below) can be somehow "twisted" to work over tropical semirings? Or over any other infinite semirings (which are not fields)?

Proof of Theorem 1: Assume that a sequence (f1,,fm)(f1,,fm) has pp different zero-patterns, and let v1,,vpRnv1,,vpRn be witnesses to these zero-patterns. Let Si={k:fk(vi)0}Si={k:fk(vi)0} be a zero-pattern witnessed by the ii-th vector vivi, and consider the polynomials gi:=kSifkgi:=kSifk. We claim that these polynomials are linearly independent over our field. This claim completes the proof of the theorem since each gigi has degree at most D:=mdD:=md, and the dimension of the space of polynomials of degree at most DD is (n+DD)(n+DD). To prove the claim, it is enough to note that gi(vj)0gi(vj)0 if and only if SiSjSiSj. Suppose contrariwise that a nontrivial linear relation λ1gi(x)++λpgp(x)=0λ1gi(x)++λpgp(x)=0 exists. Let jj be a subscript such that |Sj||Sj| is minimal among the SiSi with λi0λi0. Substitute vjvj in the relation. While λjgj(vj)0λjgj(vj)0, we have λigi(vj)=0λigi(vj)=0 for all ijij, a contradiction.

Risposte:


9

I've realized that the answer to my question is - yes: the VC dimension of degree d polynomials on n variables over any tropical semiring is at most a constant times n2log(n+d). This can be shown using Theorem 1 above. See here for details. So, BPP P/poly holds also for tropical circuits and, hence, also for "pure" dynamic programming algorithms.


N.B. (added 25.06.2019) In the mean time, I've resolved the problem completely in this paper. In such a generality, which I haven't even dreamed at the beginning. Tropical case is here just a very, very special case. And even more curiously: by just an appropriate combination of already know (deep in any respect) results of other authors.

What remains else to do in this (BPP vs. P/poly) direction? Besides the decrease of the size of resulting deterministic circuits (an interesting question in itself).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.