Limite inferiore alla stima


11

Vorrei sapere (correlato a questa altra domanda ) se erano noti limiti inferiori per il seguente problema di test: si ottiene l'accesso alla query a una sequenza di numeri non negativi e , con la promessa che o .ana1ε(0,1)k=1nak=1k=1nak1ε

Quante query (ricerche) sono sufficienti e necessarie per un algoritmo (adattivo) randomizzato per distinguere tra i due casi, con probabilità almeno ?2/3

Ho trovato un post precedente che fornisce un limite superiore logaritmico (in ) per il relativo problema di approssimazione della somma, e un limite inferiore approssimativamente corrispondente su quel problema per algoritmi deterministici; ma non sono riuscito a trovare un risultato per il problema specifico che sto prendendo in considerazione (in particolare, algoritmi randomizzati).n


Modifica: seguendo la risposta di seguito, suppongo che avrei dovuto essere più chiaro: in quanto sopra (e in particolare negli asintotici per il limite inferiore),n è la quantità "principale" vista come andare all'infinito, mentre ε è un (arbitrariamente piccolo ) costante.


Immagino che intendi . k=1nak1ε
RB

Effettivamente - risolto.
Clemente C.

Bene, senza l'ordine sarebbe necessaria una dipendenza da , credo (con o senza campionamento). Un esempio "cattivo" (coppia di sequenze) sarebbe per esempio una sequenza con tutta una k 's essendo uguale a 1 - εnak , tranne una (arbitraria, casuale)jtale cheunjè o uguale aε(nella prima sequenza) e0(nel secondo). SenzaΩ(n)query, le due sequenze non possono essere distinte ...1εn1jajε0Ω(n)
Clemente C.

Suppongo che il modello di query ti permetta di scegliere la per la quale richiedi una k , giusto? kak
Kodlu,

Sì (puoi scegliere il punto da "rivelare").
Clemente C.

Risposte:


5

Ecco i limiti inferiori che posso mostrare. Immagino che per un fisso , il limite inferiore destro sia Ω ( log n ) , ma naturalmente potrei sbagliarmi.ϵΩ(logn)

Userò una sequenza decrescente (solo per comodità). Il meccanismo di base sta spezzando la sequenza in blocchi a Nel i esimo blocco Ci stanno per essere n i elementi (cioè, Σ i n i = n ).Liniini=n

Di seguito, vogliamo che l'algoritmo abbia esito positivo con probabilità , per alcuni parametri δ > 0 .1δδ>0

Primo limite inferiore: .Ω(1ϵlog1δ)

L' blocco ha n i = 2 i - 1 elementi, quindi L = lg n . Si imposta il valore di tutti gli elementi della i esima blocco essere ( 1 + X i ) / ( 2 n i L ) , dove X i è una variabile che è o 0 o 1 . Chiaramente, la somma totale di questa sequenza è α = L i = 1 1 + Xini=2i1L=lgni(1+Xi)/(2niL)Xi01 Immagina di scegliere ogniXicon probabilitàβche sia1e0altrimenti. Per stimareα, abbiamo bisogno di una stima affidabile diβ. In particolar modo, vogliamo essere in grado di distinguere la baseβ=1-4ϵe, diciamo,β=1.

α=i=1L1+Xi2niL=12+12L(i=1LXi).
Xiβ10αββ=14ϵβ=1

Ora, immagina di campionare di queste variabili casuali e lascia che Z 1 , ... , Z m siano le variabili campionate. Impostazioni Y = m i = 1 ( 1 - X i ) (nota che stiamo prendendo la somma delle variabili del complemento ), abbiamo μ = E [ Y ] = ( 1 - β ) m e la disuguaglianza di Chernoff ci dice che se β = 1 - 4mZ1,,ZmY=i=1m(1Xi)μ=E[Y]=(1β)m , quindi μ = 4 ε m , e la probabilità di fallimento è P [ Y 2 ε m ] = P [ Y ( 1 - 1 / 2 ) μ ]exp ( - μ ( 1 / 2 ) 2 / 2 ) = exp ( - ϵ m / 2 ) . Per ridurre questa quantità diβ=14ϵμ=4ϵm

P[Y2ϵm]=P[Y(11/2)μ]exp(μ(1/2)2/2)=exp(ϵm/2).
, abbiamo bisogno di m 2δ .m2ϵln1δ

L'osservazione chiave è che la disuguaglianza di Chernoff è stretta (bisogna stare attenti, perché non è corretto per tutti i parametri, ma è corretto in questo caso), quindi non si può fare di meglio (fino alle costanti).

Secondo limite inferiore: .Ω(logn/loglogn)

Impostare la esima dimensione del blocco di essere n i = L i , dove L = Θ ( log n / log log n ) è il numero di blocchi. Un elemento nel i esimo blocco ha valore α i = ( 1 / L ) / n i . Quindi la somma totale dei valori nella sequenza è 1 .ini=LiL=Θ(logn/loglogn)iαi=(1/L)/ni1

Ora, potremmo decidere di scegliere un blocco arbitrario, dire il °, e impostare tutti i valori nel suo blocco su α j - 1 = L α j (invece di α j ). Ciò aumenta il contributo del j ° blocco da 1 / L a 1 e aumenta la massa totale della sequenza a (quasi) 2 .jαj1=Lαjαjj1/L12

Ora, in modo informale, qualsiasi algoritmo randomizzato deve verificare il valore in ciascuno dei blocchi. Come tale, deve leggere almeno valori della sequenza.L

Per rendere l'argomento sopra più formale, con probabilità , indica il sequenza originale della massa 1 come ingresso (ci riferiamo a questo come input originale). Altrimenti, selezionare casualmente il blocco con i valori aumentati (input modificato). Chiaramente, se l'algoritmo randomizzato legge meno rispetto, ad esempio, L / 8 voci, ha probabilità (circa) 1 / 8 per rilevare un ingresso modificata. Pertanto, la probabilità che questo algoritmo fallisca, se legge meno di L / 8 voci è almeno ( 1 - p ) ( 7 /p=1/21L/81/8L/8

(1p)(7/8)>7/16>1/3.

PS Penso che prestando maggiore attenzione ai parametri, il primo limite inferiore può essere migliorato a .Ω(1/ϵ2)


Grazie per questo! Ho una piccola domanda riguardo al primo, lb (più in particolare il possibile miglioramento quadratico). Dato che qui abbiamo il problema della promessa unilaterale, che implica che non appena l'algoritmo "vede" qualsiasi valore che fornisce l'evidenza che β < 1 , si può concludere senza dover ottenere una stima più accurata di β : non questo significa che il 1 / ε è ottimale per questa costruzione, sostanzialmente come ci si aspetterebbe o tutti X i 's ad 1, o almeno ε frazione non essere? Ω(1/ϵ)β<1β1/ϵXiϵ
Clemente C.

Si. Se vuoi un rally per distinguere solo tra 1 e 1-epsilon, ovviamente non puoi migliorare il limite inferiore ... Stavo pensando di provare a distinguere altre gamme ... s
Sariel Har-Peled

4

Limite inferiore

Ω(1/ϵ)

a1,,anϵ,2ϵ,3ϵ,4ϵ,na1++an=1n1/2ϵ

a1,,anϵa1=a1a2=a2ai=aiϵa1++an=1ϵ

a1,,ana1,,aniΩ(n)n1/2ϵΩ(1/ϵ)

Limite superiore

O(lg(n/ϵ)[lgn+1/ϵ2])

[0,1]

[0,1]=[0,0.25ϵ/n](0.25ϵ/n,0.5ϵ/n](0.5ϵ/n,ϵ/n](ϵ/n,2ϵ/n](2ϵ/n,4ϵ/n](,1].

aiaiai[,u]i,jai,,aj[,u]O(lg(n/ϵ))

Ora stimeremo la somma dei valori in ciascun intervallo. La prima gamma verrà gestita separatamente da tutto il resto:

  • [0,0.25ϵ/n)0m×0.25ϵ/nmmn0.25ϵ

  • δO(1/δ2)2×δ=0.25ϵ

0.25ϵ0.25ϵ0.5ϵ11ϵ


Grazie - questo sembra interessante (per quanto posso dire, non è lo stesso approccio di quello usato nel documento / discussione sopra linkato) e darò uno sguardo più profondo a quello che hai scritto. Tuttavia, sto cercando un limite inferiore anziché superiore, ovvero quante query sono necessarie .
Clemente C.

(Col passare del tempo, sto assegnando la "generosità" alla risposta, tuttavia, anche se sto ancora cercando un riferimento per un limite inferiore, se ce n'è uno da qualche parte lassù.)
Clemente C.

2
@ClementC., Ho aggiunto un limite inferiore, per la tua richiesta.
DW,

nε
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.