Stima della dimensione VC


12

Cosa si sa del seguente problema?

Data una raccolta di funzioni f : { 0 , 1 } n{ 0 , 1 } , trova una sottocollection più grande S C soggetta al vincolo che VC-Dimensione ( S ) k per un numero intero k .Cf:{0,1}n{0,1}SC(S)kk

Esistono algoritmi di approssimazione o risultati di durezza per questo problema?


Le funzioni sembrano non avere alcun ruolo nel massimizzare | S |
Suresh Venkat,

La scelta delle funzioni determina la dimensione VC di S. Il problema è trovare una classe di funzioni il più ampia possibile, soggetta a un vincolo della dimensione VC.
Aaron Roth,

Vedo. Quindi tradotto in "terra della geometria", ti viene data una raccolta di intervalli (f funge da funzione caratteristica) e vuoi una più grande raccolta di dimensioni VC limitate.
Suresh Venkat,

L'altro problema nel rispondere alla domanda: come viene presentato C? Sappiamo che la dimensione massima possibile di è O ( 2 n k ) secondo il Lemma di Sauer, e scrivere anche una sola funzione in C richiede n bit. SO(2nk)Cn
Suresh Venkat,

1
Giusto. Sono interessato ai risultati in qualsiasi regime di rappresentanza. È possibile immaginare che sia presentato come 2 n × | C | matrice, nel qual caso tempo di esecuzione 2 n × | C | sarebbe `` efficiente '' (anche se non tempo 2 n × k , che è quello che sarebbe necessario per verificare in modo esaustivo se tutte le raccolte di k punti fossero state frantumate). Se sono possibili risultati algoritmici con un semplice accesso alla query black-box alle funzioni in C , sarebbe ancora meglio. C2n×|C|2n×|C|2n×kkC
Aaron Roth,

Risposte:


7

Modifica : il problema originale è -duro ravvicinamento quando k = 1 , dove n indica il numero di serie.n1ϵk=1n

Il doppio di un ipergrafo si ottiene scambiando vertici con bordi e preservando le incidenze. È più facile capire il problema quando notiamo che un ipergrafo ha la dimensione VC 1 se il suo doppio è privo di croce (per tutti in A , almeno uno di P Q , P Q , Q P , ( P Q ) c è vuoto).P,QAPQ,PQ,QP,(PQ)c

Per dualità il problema originale (per ) equivale a, dato un ipergrafo ( V , S ) , trovare una U V di dimensione massima con ( U , { S U S S } ) senza croce.k=1(V,S)UV(U,{SUSS})

In realtà, questo (doppio) problema è molto difficile anche quando tutti gli insiemi in hanno dimensione 2: quindi è un grafico e stiamo cercando una dimensione di vertice di dimensione massima il cui sottografo indotto che non contiene alcun percorso a due bordi ( non è difficile vedere questo è l'unico modo in cui può sorgere una coppia di attraversamenti, supponendo che il grafico abbia almeno 4 vertici). Ma questa proprietà è ereditaria e non banale e quindi possiamo usare un risultato di Feige e Kogan per mostrare durezza.S

Risposta originale

Il doppio problema per (trova una dimensione massima S tale che la dimensione VC doppia di S sia al massimo 1) è difficile da approssimare entro n 1 - ϵ (in una famiglia con Θ ( n ) insiemi).k=1SSn1ϵΘ(n)

La ragione di ciò è che la doppia dimensione VC di una famiglia è 1 se vale quanto segue: per tutte P , Q in A , almeno una di P Q , P Q , Q P , ( P Q ) c è vuoto. (Vale a dire VC-dim = 1 è il doppio di ciò che viene spesso chiamato cross-freeness.)AP,QAPQ,PQ,QP,(PQ)c

Riduciamo dal set indipendente al calcolo della sottofamiglia cross-free di dimensioni massime. Dato un grafico costruisci un ipergrafo H = ( X , S ) dove X = V E { 0 } per alcuni elementi fittizi 0 . Per ogni vertice v di G , aggiungiamo il seguente set T v a S : { v } { e eG=(V,E)H=(X,S)X=VE{0}0vGTvS

{v}{ee is an edge incident to v}.

Non è difficile mostrare una famiglia è attraversamento libero sse U è indipendente in G .{Tv}vUUG

Ma per il problema originale (primordiale), sembra necessario un po 'più di pensiero ... sembra interessante!


4

Alcuni lavori correlati rilevanti: stimare la dimensione VC stessa (figuriamoci trovare una grande sottocollection con dimensione VC limitata) nella rappresentazione è LOGNP completo (LOGNP è NP limitato a registrare n bit di non determinismo). C'è anche un po 'di lavoro correlato sulla stima e l'approssimazione della dimensione VC quando la presentazione dello spazio della gamma è più compatta (vedi anche i riferimenti all'interno)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.