Valanga come processo stocastico


16

Considera il seguente processo:

Ci sono bidoni disposti dall'alto verso il basso. Inizialmente, ogni cestino contiene una palla. In ogni passo, noin

  1. scegli una palla uniformemente a caso eb
  2. sposta tutte le palline dal cestino contenente nel cestino sottostante. Se era già il cestino più basso, rimuoviamo le palline dal processo.b

Quanti passi ci vuole in attesa fino al termine del processo, ovvero fino a quando tutte le palline sono state rimosse dal processo? Questo è stato studiato prima? La risposta segue facilmente da tecniche conosciute?n

Nel migliore dei casi, il processo può terminare dopo passaggi. Nel peggiore dei casi può prendere Θ ( n 2 ) passi. Entrambi i casi dovrebbero tuttavia essere molto improbabili. La mia congettura è che ci vogliono Θ ( n log n ) passaggi e ho fatto alcuni esperimenti che sembrano confermare questo.nΘ(n2)Θ(nlogn)

(Notare che selezionare un cestino in modo uniforme a caso è un processo molto diverso che ovviamente richiederà passaggi per terminare.)Θ(n2)


La domanda sembra interessante (anche se non conosco la risposta). Sembra difficile a causa della non monotonicità; se tutte le n palline si trovano nel cestino superiore, il processo termina chiaramente in esattamente n fasi.
Tsuyoshi Ito,

Risposte:


11

Non proprio una risposta, ma un commento esteso sulla risposta di András.

La risposta di András contiene una buona intuizione, anche se non credo sia un calcolo rigoroso del numero previsto di passaggi. Penso che sia forse una buona approssimazione per una risposta, ma non sembra trattare correttamente i casi in cui il cestino sotto il cestino occupato più in alto diventa vuoto prima che il cestino superiore venga svuotato verso il basso. Tuttavia, questa potrebbe essere un'approssimazione ragionevole da fare (non ne sono sicuro).

Il suo calcolo contiene un errore che influisce sul ridimensionamento. Prenderò esattamente lo stesso punto di partenza, rifare ed espandere il calcolo.

Manca un fattore di p all'interno della somma, poiché la probabilità di scegliere casualmente il contenitore corretto è anziché1pn . Di conseguenza abbiamo1n

n+p=1nk=0(k+1)pn(npn)k=n+p=1npnk=0(k+1)(npn)k=n+p=1npnn2p2=n+np=1n1/p=n(1+Hn)

dove è l'ennesimo numero di armoniche . Per approssimare H n possiamo semplicemente sostituire la somma con un integrale: H nn + 1 1 1Hn=p=1n1/pHn. Pertanto il ridimensionamento èn(1+log(n+1))o approssimativamentenlog(n+1). Sebbene questo ridimensionamento non corrisponda esattamente al ridimensionamento del problema (vedere la simulazione di seguito) è quasi esattamente un fattore dilog(2).Hn1n+11xdx=log(n+1)n(1+log(n+1))nlog(n+1)log(2)

Simulazione vs teoria

Cerchi rossi: punti dati dalla simulazione del processo mediati su 10k corse. Verde: . Blu: n registro ( n + 1 ) .nlog2(n+1)nlog(n+1)


@Joe: Bel lavoro! Sarebbe interessante ora mostrare rigorosamente come il fattore proviene dalla creazione di lacune. ln2
András Salamon,

@ András: Non ho davvero una buona sensazione se questa è una buona approssimazione da fare o meno. L'idea di Peter di formare grappoli che si spostano verso il basso, sembra che dovrebbe dare l'espressione corretta supponendo che si formino ugualmente in qualsiasi contenitore.
Joe Fitzsimons,

@Joe: la maggior parte della palla rimarrà isolata in quasi 1/3 dei casi. Considera le prime 3 palle. Se quello centrale viene scelto per primo (tra questi 3), si unirà al terzo. Questi due, da quel momento in poi, si muoveranno due volte più velocemente della palla in alto. La distanza tra loro e la palla superiore è una camminata casuale fortemente distorta e la probabilità che la palla superiore raggiunga è limitata da una piccola costante (ish) (stima approssimativa del 15%). Ma la buona notizia è che le migliori palle log non dovrebbero davvero importare. Se tutto il resto viene cancellato in passaggi n \ log n, aggiungeranno solo passaggi n \ log n aggiuntivi.
Matthias,

nlogn

@Matthias: analizzare il tempo previsto supponendo che l'intuizione di Peter sia corretta non è il blocco stradale (almeno dal mio punto di vista). Per me dimostrare che questa intuizione è in realtà un riflesso equo di ciò che accade è necessario prima, anche se sospetto che sia una buona approssimazione.
Joe Fitzsimons,

9

Modifica: lascio questa risposta così com'è (per ora) per illustrare il disordinato processo di dimostrazione dei teoremi, qualcosa che viene lasciato fuori dagli articoli pubblicati. L'intuizione di base qui è che è sufficiente concentrarsi sulla palla in alto, in quanto spazza via tutto sotto di essa. Si prega di vedere i commenti (in particolare @Michael sottolineando che possono verificarsi lacune) e la successiva risposta di @ Joe per come gli errori sono stati identificati e corretti. Mi piace particolarmente l'uso di esperimenti da parte di Joe per ricontrollare che le formule fossero sensate.


n(1+π2/6)n

b1b2bnB1=n, B2n-1, ..., Bion-io+1. Ulteriori condizioni sono necessarie sulla sequenza per evitare che vengano scelte le palle che non sono più nel sistema, ma ai fini di un limite superiore, supponiamo che ci sia una sequenza infinita decrescente di contenitori (quindi le palle non scompaiono quando si lascia il cestino 1, ma vengono spostati nel cestino 0, quindi nel cassetto -1 e così via). Quindi il numero previsto di passaggi per una tale sottosequenza da visualizzare è il numero previsto di passaggi primaB1 is seen, plus the expected number of steps before b2 is seen, and so on (down to 1, since bn can be any of the numbers 1,2,,n). These can be seen as separate events, one after the other. The expected number of steps is then

n+p=1nk=0k+1n(npn)k=n+p=1n11npk=1k(npn)k=n+p=1n11npn(np)/p2=n+np=1n11/p2(1+π2/6)n.


3
@Andras @Joe: Holy schmoley. If all the people asking the questions on this site took their questions as seriously as you take answering them, this would be the badassest url on the internet.
Aaron Sterling

1
@András: I'm trying to understand your statement "a sequence of balls will clear all the bins precisely if it contains a subsequence...". Maybe I've misunderstood something, but say we have four balls. If the sequence is 3,4,3,2,4 then it seems to satisfy your subsequence requirement, yet not all the bins have been cleared.
Michael

1
@András: If you want to show a reasonable upper bound, you have to use the fact that balls disappear from the process and are no longer picked. Otherwise, the top most ball is always only picked with probability 1/n and there is a good chance (maybe slightly less than 1/2) that this ball will stay isolated the whole time. For this ball, you will need n^2 steps.
Matthias

1
@Michael: I think you have identified the mistake. I'm assuming falsely that the top ball will move down even if there is a gap.
András Salamon

2
Here's my intuition. After a few steps, some clump of balls is going to be larger than any other clump of balls. At this point, the clump moves faster than everything else, clears everything below it and falls out of the system. This whole process should take O(n) or maybe O(nlogn) steps. This first clump is uniformly distributed in the line, so on average it takes half the balls with it. Now, we're left with a system of around n/2 balls, and another clump forms. So after around logn clumps, we're done.
Peter Shor
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.