Lanciando palle in bidoni, stimare un limite inferiore della sua probabilità


14

Questo non è un compito, anche se sembra. Qualsiasi riferimento è il benvenuto. :-)

Scenario: ci sono palline n diverse e bidoni diversi (etichettati da 1 a , da sinistra a destra). Ogni palla viene lanciata in modo indipendente e uniforme in bidoni. Sia il numero di palline -esimo contenitore. Lascia che denoti il ​​seguente evento.n nf(i)iEi

Per ogni ,jikjf(k)j1

Cioè, i primi cassoni (più a sinistra bin) contiene meno di palline, per ogni .jjjji

Domanda: Stima , in termini di ? Quando diventa infinito. È preferibile un limite inferiore. Non credo esista una formula facilmente calcolabile.i<nPr(Ei)nn

Esempio: . Nota Pr (E_n) = 0 .limnPr(E1)=limn(n1n)n=1ePr(En)=0

La mia ipotesi: suppongo i<nPr(Ei)=lnn , quando n diventa infinito. Ho considerato i primi lnn elementi della sommatoria.


1
Sembra una sottostima del problema del compleanno ..
Gopi

@Gopi Non riesco a convincermi che la mia domanda sia un problema di compleanno limitato. Puoi spiegarlo esplicitamente? Grazie mille. Nota: il vincolo è sulla somma delle palline nei primi bin , non sul numero di bin sul contenitore specifico. j
Peng Zhang,

Anzi, mio ​​male, dopo aver riletto l'articolo di Wikipedia sul problema del compleanno, mi sono reso conto che stavo considerando un altro problema che è stato adattato dal problema del compleanno.
Gopi,

2
Alcune idee errate ... Quindi pensa a come codificare uno stato: leggi il modulo bin da sinistra a destra. Se il primo cestino ha i palline, emette una sequenza di i seguita da uno 0. Fallo per tutti i contenitori da sinistra a destra. La tua codifica sembra essere quella che ti interessa nel più grande in modo tale che questa stringa binaria (che ha n zero e n uno) per la prima volta ne contenga più di zero. Ora, facciamo un salto nel destino e generiamo lo 0 e 1 con uguale probabilità . (Questa potrebbe essere una totale assurdità). Questo problema è legato ai numeri catalani e alle parole Dyck. E...??? 1/2
Sariel Har-Peled,

4
Nella tua definizione non vedo perché sia ​​importante che le palle siano diverse. Inoltre, l'integrazione di stringhe tiene conto del fatto che i bin sono diversi.
Sariel Har-Peled,

Risposte:


11

EDIT: (08-08-2014) Come sottolinea Douglas Zare nei commenti, l'argomento di seguito, in particolare il "ponte" tra le due probabilità, è errato. Non vedo un modo semplice per risolverlo. Lascerò la risposta qui poiché credo che fornisca ancora un po 'di intuizione, ma sappi che non è vero in generale.

Pr(Em)l=1mPr(Fl)

Questa non sarà una risposta completa, ma si spera che abbia abbastanza contenuti che tu o qualcuno più esperto di me possa finirlo.

Considera la probabilità che esattamente palle cadano nei primi (di n ) contenitori:lkln

(nK)(ln)K(n-ln)n-K

Chiama la probabilità che meno di pallina cada nei primi bidoni :l F lllFl

Pr(Fl)=ΣK=0l-1(nK)(ln)K(n-ln)n-K

La probabilità che l'evento, , sopra si verifica è inferiore se abbiamo considerato ciascuno dei eventi che si verificano in modo indipendente e tutto in una volta. Questo ci dà un ponte tra i due:F lElFl

Pr(Em)Πl=1mPr(Fl)=Πl=1m(ΣK=1l-1(nK)(lnK)(n-ln)n-K)=Πl=1mF(l-1;n,ln)

Dove è la funzione di distribuzione cumulativa per la distribuzione binomiale con . Basta leggere alcune righe sulla pagina di Wikipedia e notare che , possiamo usare la disuguaglianza di Chernoff per ottenere:p=lF(l-1;n,ln) (l-1pn)p=ln(l1pn)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

Dove è il 'th Harmonic Number , è la costante di Euler-Mascheroni e la disuguaglianza per è presa dalla pagina collegata di MathWorld di Wolfram. m γ H mHmmγHm

Non preoccuparti del fattore , questo alla fine ci dà:e1/4m

Pr(Em)eγ/2m

Di seguito è riportato un diagramma log-log di una media di 100.000 istanze per in funzione di con la funzione tracciata anche come riferimento:m e - γ / 2n=2048meγ/2m

inserisci qui la descrizione dell'immagine

Mentre le costanti sono disattivate, la forma della funzione sembra essere corretta.

Di seguito è riportato un diagramma log-log per variare con ogni punto che rappresenta la media di 100.000 istanze in funzione di :mnm

inserisci qui la descrizione dell'immagine

Infine, arrivando alla domanda originale a cui volevi rispondere, dato che sappiamo che abbiamo:Pr(Em)1m

i<nPr(Ei)n

E come verifica numerica, di seguito è riportato un diagramma log-log della somma, , rispetto alla dimensione dell'istanza, . Ogni punto rappresenta la media della somma di 100.000 istanze. La funzione è stata tracciata come riferimento:n x 1 / 2Snx1/2

inserisci qui la descrizione dell'immagine

Mentre non vedo alcuna connessione diretta tra i due, i trucchi e la forma finale di questo problema hanno molti punti in comune con il problema del compleanno, come inizialmente indovinato nei commenti.


4
Come si ottiene ? Ad esempio, per , ho calcolato cheSe ti viene detto che il primo cestino è vuoto, ciò rende più o meno probabile che i primi due contenitori contengano al massimo palla? È più probabile, quindi è una sottovalutazione. n = 100 P r ( E 2 ) = 0.267946 > 0.14761 = P r ( F 1 ) P r ( F 2 ) . 1 P r ( F 1 ) P r ( F 2 )Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).1Pr(F1)Pr(F2)
Douglas Zare,

@DouglasZare, ho verificato i tuoi calcoli, hai ragione. Mi serve bene per non essere più rigoroso.
user834

15

La risposta è .Θ(n)

Innanzitutto, calcoliamo .En1

Supponiamo di lanciare palline in bidoni e di osservare la probabilità che un bidone contenga esattamente palline. Questa probabilità deriva dalla distribuzione di Poisson e quando va a la probabilità che ci siano esattamente palline in un dato bin è .n k n k 1nnknk1e1k!

Ora, esaminiamo un modo diverso di distribuire le palline nei contenitori. Lanciamo un numero di palline in ogni cestino scelto dalla distribuzione di Poisson e condizioniamo nel caso in cui ci siano palline in totale. Sostengo che ciò dia esattamente la stessa distribuzione del lancio di palline in bidoni. Perché? E 'facile vedere che la probabilità di avere palle nel esimo bin è proporzionale a In entrambe le distribuzioni.n n k j j n j = 1 1nnnkjjj=1n1kj!

Quindi consideriamo una camminata casuale in cui ad ogni passo, vai da a con probabilità . Sostengo che se si condiziona l'evento che questa camminata casuale ritorna a 0 dopo passaggi, la probabilità che questa casuale rimanga sempre sopra è la probabilità che l'OP vuole calcolare. Perché? Questa altezza di questa passeggiata casuale dopo passi è meno il numero di palline nei primi bidoni.t + 1 - k 1tt+1kn0sss1e1k!n0sss

Se avessimo scelto una camminata casuale con una probabilità di di salire o scendere su ogni passaggio, questo sarebbe il classico problema di scrutinio , per il quale la risposta è . Questa è una variante del problema di scrutinio che è stata studiata (vedi questo documento ) e la risposta è ancora . Non so se esiste un modo semplice per calcolare la costante per per questo caso. 11121 Θ(112(n1)Θ(1Θ(1n)Θ(1n)

Lo stesso documento mostra che quando la camminata casuale è condizionata a terminare all'altezza , la probabilità di rimanere sempre positivi è fintanto che . Questo fatto ci consentirà di stimare per qualsiasi .kΘ(k/n)k=O(n)Ess

Sarò un po 'handwavy per il resto della mia risposta, ma le tecniche di probabilità standard possono essere utilizzate per renderlo rigoroso.

Sappiamo che siccome va a , questa camminata casuale converge in un ponte browniano, cioè un moto browniano condizionato per iniziare e terminare con . Dai teoremi di probabilità generali, per , la camminata casuale è approssimativamente a lontano dall'asse . Nel caso abbia altezza , la probabilità che sia rimasta sopra per tutto il tempo prima che sia . Poiché è probabile che sia quando , abbiamon0ϵn<s<(1ϵ)nΘ(n)xt>00sΘ(t/s)tΘ(n)s=Θ(n)EsΘ(1/n).


4

[Modifica 13-08-2014: Grazie a un commento di Peter Shor, ho modificato la mia stima del tasso di crescita asintotica di questa serie.]

La mia convinzione è che cresce come limni<nPr(Ei) . Non ho una prova ma penso di avere un argomento convincente.n

Sia una variabile casuale che dia il numero di palline nel cestino i . Sia B i , j = j k = i B k una variabile casuale che dia il numero totale di sfere nei contenitori da i a j compreso.Bi=f(i)iBi,j=k=ijBkij

Ora puoi scrivere per qualsiasi j < i . A tal fine, introduciamo la funzione π e g i .Pr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

Possiamo scrivere in termini di g i :Pr(Ei)gi

Pr(Ei)=gi(1,i1,0)

Ora, è chiaro dalla definizione di chegi

Pr(Ei)=(ni)ni+1nnhi(n)

dove è un polinomio in n di grado i - 1 . Questo ha anche un senso intuitivo; almeno n - i + 1 palline dovranno essere inserite in uno dei ( i + 1 ) th through n th bins (di cui ci sono n - i ).hi(n)ni1ni+1(i+1)nni

Poiché stiamo parlando di quando n , è rilevante solo il coefficiente di piombo di h i ( n ) ; chiamiamo questo coefficiente a i . PoiPr(Ei)nhi(n)ai

limnPr(Ei)=aiei

Come calcoliamo ? Bene, è qui che farò un piccolo giro a mano. Se elaborate le prime E i , vedrete che emerge un modello nel calcolo di questo coefficiente. Puoi scriverlo comeaiEi

dove μ i ( j , k , b ) = { 0 k < 0 1 k > = 0 i > j j - b - 1 l = 0 1

ai=μi(1,i1,0)
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

Ora, non sono stato in grado di derivare direttamente un equivalente in forma chiusa, ma ho calcolato i primi 20 valori di :Pr(Ei)

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

Ora, risulta che

Pr(Ei)=iii!ei=Pois(i;i)

Pois(i;λ)Xiλ

limni=1nPr(Ei)=x=1xxx!ex

Pr(Ei)

limnPr(Ex)=xxx!ex12πx

Permettere

ϕ(x)=12πx

Da

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x)
  • 1nϕ(x)dxn

1nϕ(x)dx

i=1nPr(Ei)=Θ(n)

1
XX/(X!eX)1/2πX

@PeterShor Grazie! Ho aggiornato la conclusione grazie alla tua intuizione e ora sono d'accordo con le altre due risposte. È interessante per me vedere 3 approcci abbastanza diversi a questo problema.
ruds

4

nnn12π2

n!2nnk=0n2nkk!
and there is no closed-form answer.

Oeis è davvero fantastico
Thomas Ahle,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.