Distanza statistica tra moneta uniforme e di parte


9

Let U tramite la distribuzione uniforme su n bit, e sia D essere distribuiti su n bit nella quale i bit sono indipendenti e ogni bit è 1 con probabilità 1/2ϵ . È vero che la distanza statistica tra D e U è Ω(ϵn), quandon1/ϵ2?


2
Sì. La distanza statistica tra U e V è almeno PrU(xi>n/2)PrD(xi>n/2) , che è Ω(εn); vedi ad esempio la risposta di matus qui:cstheory.stackexchange.com/questions/14471/…
Yury

2
Grazie. Forse spiegare come ottenerlo da ciò che Matus ha scritto in una risposta che posso accettare?
Manu,


1
Per quanto riguarda la risposta di Matus, puoi fare di meglio della disuguaglianza di Slud; vedi (2.13,2.14) in arxiv.org/abs/1606.08920
Aryeh

Risposte:


7

x1,,xnUDPrU(xit)PrD(xit)tt=n/2+n

Nota che per una costante assoluta . Se , allora la distanza statistica è almeno e abbiamo finito. Quindi supponiamo di seguito che .PrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

Sia per iid Bernoulli variabili casuali con . Il nostro obiettivo è dimostrare che . In base al teorema del valore medio, per alcuni . Ora proveremo che ; ciò implica che la distanza statistica desiderata è almeno , come richiesto.f(s)=Pr(xit)x1,,xnPr(xi=1)=1/2sf(0)f(ε)=Ω(εn)

f(0)f(ε)=εf(ξ),
ξ(0,ε)f(ξ)Ω(n)Ω(nε)

Scrivi, e Nota che Così,

f(ξ)=kt(nk)(12ξ)k(12+ξ)nk,
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
f(ξ)4nkt(nk)(12ξ)k(12+ξ)nk=4nf(ξ)4nf(ε)4n(c1/2).
Qui abbiamo usato l'assunto che . Abbiamo mostrato che .f(ε)=PrD(x1++xnt)c1/2f(ξ)=Ω(n)

5

Una prova un po 'più elementare e leggermente più disordinata (o almeno mi sembra).

Per comodità, scrivi , con per ipotesi.ε=γnγ[0,1)

Abbiamo esplicitamente ridotto l'espressione di : dTV(P,U)

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
dove è una costante assoluta. Abbassiamo separatamente ogni summand: correggiamo e scriviamo , modo che ogni summand sia limitato da una quantità che converge (quando ) aC>0k=kn2[n,2n]
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
ne4γ2γ21>4γ2γ2>2γ ; sottintendendo che ognuno è . Riassumendo, questo produce come richiesto.Ω(γ)
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)

(L'uso di Hellinger come proxy a causa delle sue belle proprietà rispetto alle distribuzioni dei prodotti è allettante, e sarebbe molto più veloce, ma ci sarebbe una perdita di un fattore quadratico nel limite inferiore).
Clemente C.

1
Bello! Mi piace l'approccio elementare. Dovremmo essere in grado di renderlo non asintotico anche in .... un modo è usare , quindi usa la bella disuguaglianza . Un po 'più disordinato. n(1+z1z)n(1+2z)n1+weww2/2
usul
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.