Ci sono proprietà di distribuzione che sono "al massimo" difficili da testare?


13

Un algoritmo di test di distribuzione per una proprietà di distribuzione P (che è solo un sottoinsieme di tutte le distribuzioni su [n]) è autorizzato ad accedere ai campioni secondo una certa distribuzione D, ed è necessario decidere (whp) se o d ( D , P ) > ϵ ( d qui è solitamente la distanza 1 ). La misura più comune di complessità è il numero di campioni utilizzati dall'algoritmo.DPd(D,P)>ϵd1

Ora, nel test di proprietà standard, in cui si ha accesso alle query su alcuni oggetti, un limite inferiore lineare sulla complessità della query è ovviamente il limite inferiore più forte possibile, poiché query rivelerebbe l'intero oggetto. Questo vale anche per i test di distribuzione?n

Per quanto ho capito, il limite superiore "banale" per testare le proprietà delle distribuzioni è --- per i limiti di Chernoff, questo è sufficiente per "scrivere" una distribuzione D 'che è vicina a D in 1 distanza, e quindi possiamo solo verificare se ci sono distribuzioni vicine a D 'che sono in P (questo potrebbe richiedere un tempo infinito, ma questo è irrilevante per la complessità del campione).O(n2logn)1

  • Esiste un test "banale" migliore per tutte le proprietà di distribuzione?
  • Esistono proprietà di distribuzione per le quali sappiamo che i limiti inferiori del campione sono più forti di quelli lineari?

sembra simile a dimostrare la separazione delle classi di complessità e come potrebbe essere vicino ad alcuni noti problemi aperti ...?
vzn,

Appena visto questo ... io non sono del tutto sicuro di come si deriva il limite , ma è da notare che le distribuzioni in realtà l'apprendimento (sopra il dominio delle dimensioni n ) per TV / 1 distanza ε con probabilità 2 / 3 in realtà può essere fatto con campioni O ( n / ε 2 ) (e questo è stretto). Quindi, a meno che non si stiano osservando valori non costanti del parametro di prossimità ε , non c'è alcuna speranza di ottenere ω ( n ) limiti inferiori ...O(n2logn)n1ε2/3O(n/ε2)εω(n)
Clemente C.

Risposte:


5

Ci scusiamo per aver scoperto questo post - è piuttosto vecchio, ma ho pensato che avere una risposta potesse non essere una cattiva idea.

Innanzitutto, sembra che tu abbia eseguito il tuo limite di Chernoff con qualche impostazione leggermente strana di parametri. Si noti che per eseguire l'approccio "testing by learning" suggerito, è sufficiente apprendere la distribuzione nella distanza di variazione totale (o , se si preferisce, che è lo stesso fino a un fattore 2) per la distanza ε1 . (prima di controllare "offline" se c'è qualche distribuzionepcon la proprietàPnche a sua volta è al massimoεε2pPn dalla tua ipotesi imparato p ). Ciò porterebbe ingenuamente a unaO(nlognε2p^limite superiore della complessità del campione per questo approccio; tuttavia, è noto (e "folklore") che l'apprendimento di una distribuzione arbitraria su un dominio di dimensioninfino alla distanzaε(nella distanza di variazione totale) può essere fatto solo conO(nO(nlognε2)nεcampioni (e questo è stretto).O(nε2)

O(nε2)nεn

1/10Θε(nlogn)

(Si noti che è un po '"imbroglione", nel senso che la proprietà è semplicemente un modo per prendere una domanda di prova tollerante e rietichettarla come prova di una proprietà ad hoc ).

kkk=n/10Ω(nlogn)n100

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.