Qual è un limite inferiore stretto sul tempo di raccolta dei coupon?


20

Nel classico problema del Coupon Collector , è noto che il tempo necessario per completare una serie di coupon scelti a caso soddisfa , e .TnE[T]nlnnVar(T)n2Pr(T>nlnn+cn)<ec

Questo limite superiore è migliore di quello dato dalla disuguaglianza di Chebyshev, che sarebbe all'incirca 1/c2 .

La mia domanda è: esiste un corrispondente limite inferiore migliore di Chebyshev per T ? (ad esempio, qualcosa come Pr(T<nlnncn)<ec )?


Un limite inferiore evidente è Pr(T<n)=0 , ma immagino tu ne sia consapevole ...
onestop

Risposte:


14

Sto fornendo questo come una seconda risposta poiché l'analisi è completamente elementare e fornisce esattamente il risultato desiderato.

Proposta per c>0 e n1 ,

P(T<nlogncn)<ec.

L'idea alla base della dimostrazione è semplice:

  1. Rappresentare il tempo fino a quando tutti tagliandi sono raccolti come T=i=1nTi , dove Ti è il tempo che l' i esimo (finora) unico coupon viene raccolto. I Ti sono variabili casuali geometriche con tempi medi di nni+1 .
  2. Applicare e semplificare una versione del limite di Chernoff.

Prova

Per ogni e qualsiasi , abbiamo che s > 0 P ( T < t ) = P ( e - s T > e - s t ) e s t E e - s Tt s>0

P(T<t)=P(esT>est)estEesT.

Poiché e sono indipendenti, possiamo scrivere T i E e - s T = n i = 1 E e - s T iT=iTiTi

EesT=i=1nEesTi

Ora poiché è geometrico, diciamo con probabilità di successo , allora un semplice calcolo mostra p i E e - s T i = p iTipi

EesTi=pies1+pi.

I per il nostro problema sono , , , ecc. Quindi, p 1 = 1 p 2 = 1 - 1 / n p 3 = 1 - 2 / n n i = 1 E e - s T i = n i = 1 i / npip1=1p2=11/np3=12/n

i=1nEesTi=i=1ni/nes1+i/n.

Diamo scelgono e per qualche . Quindi ed , producendo t = n log n - c n c > 0 e s t = n e - c e s = e 1 / n1 + 1 / n n i = 1 i / ns=1/nt=nlogncnc>0

est=nec
es=e1/n1+1/n
i=1ni/nes1+i/ni=1nii+1=1n+1.

Mettendo insieme questo, otteniamo che

P(T<nlogncn)nn+1ec<ec

come desiderato.


È molto carino e proprio quello che ha ordinato il dottore. Grazie.
David

@ David, solo curioso: qual è l'applicazione prevista?
cardinale il

Lunga storia. Sto cercando di dimostrare un limite inferiore per il tempo di miscelazione di una catena di Markov che ho elaborato al fine di analizzare il tempo di esecuzione di un algoritmo che mi interessa - che risulta ridurre al limite inferiore della c problema .collector. A proposito, stavo giocando con il tentativo di trovare esattamente questo tipo di rilegatura in stile Chernoff, ma non avevo capito come liberarmi di quel prodotto in . Buona chiamata scegliendo :-). s = 1 / nis=1/n
David

@David, , sebbene quasi sicuramente non ottimale, sembrava la cosa ovvia da provare dato che ha dato , che è lo stesso termine di quello ottenuto nella derivazione per il limite superiore. e s t = n e - cs=1/nest=nec
cardinale il

1
Richiesta : la prova che ho dato sopra è la mia. Ci ho lavorato per divertimento, dal momento che il problema mi ha incuriosito. Tuttavia, non rivendico alcuna novità. In effetti, non riesco a immaginare che una prova simile usando una tecnica simile non esista già in letteratura. Se qualcuno sa di un riferimento, si prega di inviare come un commento qui. Sarei molto interessato a conoscerne uno.
cardinale

9

Sebbene @cardinal abbia già dato una risposta che dia esattamente il limite che stavo cercando, ho trovato un argomento simile in stile Chernoff che può dare un limite più forte:

Proposta : (questo è più forte per )c > π 2

Pr(Tnlogncn)exp(3c2π2).
c>π23

Prova :

Come nella risposta di @ cardinale, possiamo usare il fatto che è una somma di variabili casuali geometriche indipendenti con probabilità di successo . Ne segue che ed .T i p i = 1 - i / n E [ T i ] = 1 / p i E [ T ] = n i = 1 E [ T i ] = n n i = 1 1TTipi=1i/nE[Ti]=1/piE[T]=i=1nE[Ti]=ni=1n1inlogn

Definisci ora nuove variabili e . Possiamo quindi scrivere S : = i S i Pr ( T n log n - c n ) Pr ( T E [ T ] - c n ) = Pr ( S - c n ) = Pr ( exp ( - s SSi:=TiE[Ti]S:=iSi

Pr(Tnlogncn)Pr(TE[T]cn)=Pr(Scn)
=Pr(exp(sS)exp(scn))escnE[esS]

Abbiamo calcolato le medie

E[esS]=iE[esSi]=ies/pi1+1pi(es1)e12s2ipi2
dove la disuguaglianza deriva dai fatti che e anche per .es1sez1+ze12z2z0

Pertanto, poiché , possiamo scrivere ipi2=n2i=1n11i2n2π2/6

Pr(Tnlogncn)e112(nπs)2scn.

Riducendo a icona su , otteniamo finalmente s>0

Pr(Tnlogncn)e3c2π2

1
(+1) Modulo un paio di errori di battitura minori, questo è carino. Espandersi attorno a qualcosa di simile alla media come hai fatto spesso funziona meglio. Non sono sorpreso di vedere la convergenza di ordine superiore alla luce dei risultati asintotici. Ora, se si mostra un simile tale limite superiore, che si rivela è subexponential nella terminologia di Vershynin, che ha molte implicazioni per quanto riguarda la concentrazione di misura. (Tnlogn)/n
cardinale

1
L'argomento non sembra generalizzare direttamente al limite superiore. Scambiando per (e per ), si possono seguire gli stessi passi fino al punto di calcolo . A questo punto, tuttavia, il meglio che posso fare è usare , che lascia ancora e io don non so cosa farsene di questoccssE[esS]ies/pi1spiez1zexp(z22(1z))
E[esS]e12s2ipi2(1s/pi)
David

2
È interessante notare che l'intero argomento (per il limite inferiore) sembra funzionare non solo per il problema del collezionista di coupon, ma per qualsiasi somma di variabili geometriche indipendenti non identiche, con varianza limitata. In particolare: dato , dove ogni è un GV indipendente con probabilità di successo e dove , quindi T=iTiTipiipi2A<
Pr(TE[T]a)ea22A
David

4

Nota importante : ho deciso di rimuovere la prova fornita in origine in questa risposta. Era più lungo, più computazionale, usava martelli più grandi e si rivelò un risultato più debole rispetto all'altra prova che ho dato. Tutto intorno, un approccio inferiore (a mio avviso). Se sei davvero interessato, suppongo che tu possa guardare le modifiche.

I risultati asintotici che ho citato in origine e che sono ancora riportati di seguito in questa risposta dimostrano che come possiamo fare un po 'meglio del limite dimostrato nell'altra risposta, che vale per tutti .n n


Sono validi i seguenti risultati asintotici

P(T>nlogn+cn)1eec

e

P(Tnlogncn)eec.

La costante e i limiti sono presi da . Si noti che, sebbene siano separati in due risultati, sono praticamente lo stesso risultato poiché non è vincolato a non essere negativo in entrambi i casi. n ccRnc

Vedere, ad esempio, Motwani e Raghavan, algoritmi randomizzati , pagg. 60--63 per una prova.


Inoltre : David fornisce gentilmente una prova del suo limite superiore dichiarato nei commenti a questa risposta.


Sì, vale per ogni fisso . Una (molto semplice) prova può essere trovata, ad esempio nel libro di Levin, Peres e Wilmer Markov Chains and Mixing Times, Proposition 2.4. Tuttavia, la prova non funziona per il limite inferiore. n
David

1
In effetti, potrei anche trascrivere la prova qui: "Sia l'evento che il tipo -th [coupon] non appare tra i primi coupon disegnati. Osservare prima che . Poiché ogni prova ha probabilità di non disegnare il coupon e le prove sono indipendenti, il lato destro sopra è limitato da , proving (2.7). " i n log n + c n P ( τ > n log n + c n ) = P (Aiinlogn+cnP(τ>nlogn+cn)=P(iAi)iP(Ai)1n1ii(11/n)nlogn+cnnexp(nlogn+cnn)=ec
David

@ David, è carino e abbastanza semplice. Ho rapidamente giocato con l'espansione della formula di inclusione-esclusione di un altro termine, ma non sono arrivato da nessuna parte in fretta e non ho avuto il tempo di esaminarla ulteriormente. L'evento equivale all'evento in cui non sono rimasti coupon dopo le prove . Dovrebbe esserci una martingala associata a questo. Hai provato la disuguaglianza di Hoeffding sulla (presunta) martingala associata? Il risultato asintotico suggerisce una forte concentrazione di misura. t n{T<tn}tn
cardinale

@ David, c'è un segno capovolto nella tua prova sopra, ma sono sicuro che è ovvio anche per altri lettori.
cardinale

@ David, per favore vedi la mia altra risposta postata alla tua domanda. Il metodo è diverso dal limite superiore che dai, ma gli strumenti impiegati sono quasi altrettanto elementari, in contrasto con la risposta che ho dato qui.
cardinale il

2

Benjamin Doerr fornisce (nel capitolo "Analisi dell'euristica della ricerca randomizzata: strumenti dalla teoria della probabilità" nel libro "Teoria dell'euristica della ricerca randomizzata", vedere il collegamento per un PDF online) una prova in qualche modo semplice di

Proposizione Lascia che sia il tempo di arresto del processo di raccolta dei coupon. Quindi .TPr[T(1ϵ)(n1)lnn]enϵ

Questo sembra dare gli asintotici desiderati (dalla seconda risposta di @ cardinale), ma con il vantaggio di essere veri per tutti e .nϵ

Ecco uno schizzo di prova.

Proof Sketch: lascia che sia l'evento in cui viene raccolto l' -coupon nelle prime estrazioni di . Pertanto, . Il fatto chiave è che gli sono negativamente correlati, per qualsiasi , . Intuitivamente, questo è abbastanza chiaro, come sapendo che l' coupon esimo nella prima trae renderebbe meno probabile che il coupon esimo Si richiama inoltre nel primo disegna. XiitPr[Xi=1]=(11/n)tXiI[n]Pr[iI,Xi=1]iIPr[Xi=1]itjt

Si può dimostrare l'affermazione, ma allargando l'insieme di 1 ad ogni passo. Poi si riduce a dimostrare che , per . Equivalentemente, facendo una media, si riduce a mostrare che . Doerr fornisce solo un argomento intuitivo per questo. Una strada per una prova è la seguente. Si può osservare che condizionato dal coupon proveniente da tutti i coupon in , che la probabilità di trarre un nuovo coupon da dopo aver disegnato finora è ora , invece del precedenteIPr[iI,Xi=1|Xj=1]Pr[iI,Xi=1]jIj I I k | Io | - kPr[iI,Xi=1|Xj=0]Pr[iI,Xi=1]jIIk | Io| -k|I|kn1 jio|I|kn . Quindi, decomponendo il tempo per raccogliere tutti i coupon come una somma di variabili geometriche casuali, possiamo vedere che il condizionamento sul -coupon viene dopo che aumento le probabilità di successo, e quindi fare il condizionamento rende solo più probabile la raccolta dei coupon prima dal dominio stocastico: ogni variabile geometrica casuale viene aumentata, in termini di dominio stocastico, dal condizionamento, e questo dominio può quindi essere applicato alla somma).jI

Data questa correlazione negativa, ne consegue che , che dà il desiderato desiderato con . t = ( 1 - ϵ ) ( n - 1 ) ln nPr[T(1ϵ)(n1)lnn](1(11/n)t)nt=(1ϵ)(n1)lnn

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.