Perché il numero di variabili uniformi continue su (0,1) necessarie affinché la loro somma superi una ha media

Sommiamo un flusso di variabili casuali, ; lascia che sia il numero di termini di cui abbiamo bisogno affinché il totale superi uno, ovvero è il numero più piccolo tale che $X_i \overset{iid}\sim \mathcal{U}(0,1)$ $Y$ $Y$

X_{1} + X_{2} + \dots + X_{Y} > 1.

$X_1 + X_2 + \dots + X_Y > 1.$

Perché la media di $Y$ uguale alla costante Eulero $e$ ?

E (Y) = e = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \dots

$\mathbb{E}(Y) = e = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \dots$

— pesciolino d'argento
fonte

Sto pubblicando questo nello spirito di una domanda di studio autonomo, anche se penso di aver visto questa domanda per la prima volta oltre un decennio fa. Non riesco a ricordare come ho risposto allora, anche se sono sicuro che non mi è venuto in mente quando ho visto questa proprietà menzionata nel thread Approssimazione

e

$e$ usando la simulazione Monte Carlo . Dal momento che sospetto che questa sia una domanda di esercizio abbastanza comune, ho optato per presentare uno schizzo piuttosto che una soluzione completa, anche se suppongo che il principale "avviso di spoiler" appartenga alla domanda stessa!

— Silverfish,

Rimango molto interessato ad approcci alternativi; So che questo è stato incluso come una domanda nella teoria della probabilità di Gnedenko (originariamente in russo ma ampiamente tradotto), ma non so quale soluzione ci si aspettasse lì, o posta altrove.

— Silverfish,

Ho scritto una soluzione di simulazione in MATLAB usando il tuo metodo simplex. Non sapevo del collegamento ai simplex, è così inaspettato.

— Aksakal,

Risposte:

Prima osservazione: $Y$ ha un CDF più piacevole di PMF

La funzione di massa di probabilità $p_Y(n)$ è la probabilità che $n$ sia "appena sufficiente" perché il totale superi l'unità, cioè $X_1 + X_2 + \dots X_n$ supera uno mentre $X_1 + \dots + X_{n-1}$ fa non.

La distribuzione cumulativa $F_Y(n) = \Pr(Y \leq n)$ richiede semplicemente che $n$ sia "sufficiente", cioè $\sum_{i=1}^{n}X_i > 1$ senza alcuna limitazione di quanto. Sembra un evento molto più semplice da gestire con la probabilità di.

Seconda osservazione: $Y$ assume valori interi non negativi in modo che $\mathbb{E}(Y)$ possa essere scritto in termini di CDF

Chiaramente $Y$ può assumere solo i valori in $\{0, 1, 2, \dots\}$ , in modo da poter scrivere sua media in termini di CDF complementare , $\bar F_Y$ .

E (Y) = \sum_{n = 0}^{\infty} {\bar{F}}_{Y} (n) = \sum_{n = 0}^{\infty} (1 - F_{Y} (n))

$\mathbb{E}(Y) = \sum_{n=0}^\infty \bar F_Y(n) = \sum_{n=0}^\infty \left(1 - F_Y(n) \right)$

In effetti $\Pr(Y=0)$ e $\Pr(Y=1)$ sono entrambi zero, quindi i primi due termini sono $\mathbb{E}(Y) = 1 + 1 + \dots$ .

Per quanto riguarda i termini successivi, se $F_Y(n)$ è la probabilità che $\sum_{i=1}^{n}X_i > 1$ , quale evento è $\bar F_Y(n)$ la probabilità di?

Terza osservazione: il (iper) volume di un $n$ -simplex è $\frac{1}{n!}$

Il $n$ -simplex ho in mente occupa il volume sotto un'unità standard $(n-1)$ -simplex in tutto positivo orthant di $\mathbb{R}^n$ : è l'inviluppo convesso di $(n+1)$ vertici, in particolare l'origine più i vertici dell'unità $(n-1)$ -simplex a $(1, 0, 0, \dots)$ , $(0, 1, 0, \dots)$ ecc.

Ad esempio, il 2-simplex sopra con ha area $x_1 + x_2 \leq 1$ e il 3-simplex conha volume $\frac{1}{2}$ $x_1 + x_2 + x_3 \leq 1$ . $\frac{1}{6}$

Per una prova che procede valutando direttamente un integrale per la probabilità dell'evento descritto da , e collegamenti ad altri due argomenti, vedere questo thread Math SE . Anche il thread correlato può essere interessante: esiste una relazione tra e la somma dei volumi -simplexes? $\bar F_Y(n)$ $e$ $n$

— pesciolino d'argento
fonte

Questo è un approccio geometrico interessante e facile da risolvere in questo modo. Bellissimo. Ecco l'equazione per un volume di un simplex. Non credo che ci possa essere una soluzione più elegante, francamente

— Aksakal,

+1 Puoi anche ottenere la distribuzione completa di

da uno qualsiasi degli approcci nel mio post su stats.stackexchange.com/questions/41467/… .

Y

$Y$

— whuber

Se mi sono imbattuto in questa soluzione, non c'è modo in cui potrebbero costringermi a farlo diversamente in una scuola :)

— Aksakal

Correzione . Sia $n \ge 1$ sono le parti frazionarie delle somme parziali per . L'uniformità indipendente di e garantisce che stessa probabilità di superare in quanto deve essere inferiore. Ciò implica chetuttogli ordinamenti della sequenza sono ugualmente probabili.

U_{i} = X_{1} + X_{2} + \dots + X_{i} \mod 1

$U_i = X_1 + X_2 + \cdots + X_i \mod 1$

i = 1, 2, \dots, n

$i=1,2,\ldots, n$

X_{1}

$X_1$

X_{i + 1}

$X_{i+1}$

U_{i + 1}

$U_{i+1}$

U_{i}

$U_i$ $n!$ $(U_i)$

Data la sequenza , possiamo recuperare la sequenza . Per vedere come, notalo $U_1, U_2, \ldots, U_n$ $X_1, X_2, \ldots, X_n$

perché entrambi sono compresi tra e . $U_1 = X_1$ $0$ $1$
Se , allora . $U_{i+1} \ge U_i$ $X_{i+1} = U_{i+1} - U_i$
Otherwise, $U_i + X_{i+1} \gt 1$ , whence $X_{i+1} = U_{i+1} - U_i + 1$ .

There is exactly one sequence in which the $U_i$ are already in increasing order, in which case $1 \gt U_n = X_1 + X_2 + \cdots + X_n$ . Being one of $n!$ equally likely sequences, this has a chance $1/n!$ of occurring. In all the other sequences at least one step from $U_i$ to $U_{i+1}$ is out of order. This implies the sum of the $X_i$ had to equal or exceed $1$ . Thus we see that

Pr (Y > n) = Pr (X_{1} + X_{2} + \dots + X_{n} \leq 1) = Pr (X_{1} + X_{2} + \dots + X_{n} < 1) = \frac{1}{n!} .

$\Pr(Y \gt n) = \Pr(X_1 + X_2 + \cdots + X_n \le 1) = \Pr(X_1 + X_2 + \cdots + X_n \lt 1) = \frac{1}{n!}.$

This yields the probabilities for the entire distribution of $Y$ , since for integral $n\ge 1$

Pr (Y = n) = Pr (Y > n - 1) - Pr (Y > n) = \frac{1}{(n - 1)!} - \frac{1}{n!} = \frac{n - 1}{n!} .

$\Pr(Y = n) = \Pr(Y \gt n-1) - \Pr(Y \gt n) = \frac{1}{(n-1)!} - \frac{1}{n!} = \frac{n-1}{n!}.$

Moreover,

E (Y) = \sum_{n = 0}^{\infty} Pr (Y > n) = \sum_{n = 0}^{\infty} \frac{1}{n!} = e,

$\mathbb{E}(Y) = \sum_{n=0}^\infty \Pr(Y \gt n) = \sum_{n=0}^\infty \frac{1}{n!} = e,$

QED.

— whuber
fonte

I have read it a couple of times, and I almost get it... I posted a couple of questions in the Mathematics SE as a result of the

e

$e$ constant computer simulation. I don't know if you saw them. One of them came back before your kind explanation on Tenfold about the ceiling function of the

1 / U (0, 1)

$1/U(0,1)$ and the Taylor series. The second one was exactly about this topic, never got a response, until now...

— Antoni Parellada

here and here.

— Antoni Parellada

And could you add the proof with the uniform spacings as well?

— Xi'an

@Xi'an Could you indicate more specifically what you mean by "uniform spacings" in this context?

— whuber

I am referring to your Poisson process simulation via the uniform spacing, in the thread Approximate e using Monte Carlo Simulation for which I cannot get a full derivation.

— Xi'an

In Sheldon Ross' A First Course in Probability there is an easy to follow proof:

Modifying a bit the notation in the OP, $U_i \overset{iid}\sim \mathcal{U}(0,1)$ and $Y$ the minimum number of terms for $U_1 + U_2 + \dots + U_Y > 1$ , or expressed differently:

Y = m i n {n : \sum_{i = 1}^{n} U_{i} > 1}

$Y = min\Big\{n: \sum_{i=1}^n U_i>1\Big\}$

If instead we looked for:

Y (u) = m i n {n : \sum_{i = 1}^{n} U_{i} > u}

$Y(u) = min\Big\{n: \sum_{i=1}^n U_i>u\Big\}$ for

u \in [0, 1]

$u\in[0,1]$ , we define the

f (u) = E [Y (u)]

$f(u)=\mathbb E[Y(u)]$ , expressing the expectation for the number of realizations of uniform draws that will exceed

u

$u$ when added.

We can apply the following general properties for continuous variables:

$E[X] = E[E[X|Y]]=\displaystyle\int_{-\infty}^{\infty}E[X|Y=y]\,f_Y(y)\,dy$

to express $f(u)$ conditionally on the outcome of the first uniform, and getting a manageable equation thanks to the pdf of $X \sim U(0,1)$ , $f_Y(y)=1.$ This would be it:

\begin{matrix} (1) & f (u) = \int_{0}^{1} E [Y (u) | U_{1} = x] d x \end{matrix}

$f(u)=\displaystyle\int_0^1 \mathbb E[Y(u)|U_1=x]\,dx \tag 1$

If the $U_1=x$ we are conditioning on is greater than $u$ , i.e. $x>u$ , $\mathbb E[Y(u)|U_1=x] =1 .$ If, on the other hand, $x <u$ , $\mathbb E[Y(u)|U_1=x] =1 + f(u - x)$ , because we already have drawn $1$ uniform random, and we still have the difference between $x$ and $u$ to cover. Going back to equation (1):

f (u) = 1 + \int_{0}^{x} f (u - x) d x

$f(u) = 1 + \displaystyle\int_0^x f(u - x) \,dx$ , and with substituting

w = u - x

$w = u - x$ we would have

f (u) = 1 + \int_{0}^{x} f (w) d w

$f(u) = 1 + \displaystyle\int_0^x f(w) \,dw$ .

If we differentiate both sides of this equation, we can see that:

f^{'} (u) = f (u) ⟹ \frac{f^{'} (u)}{f (u)} = 1

$f'(u) = f(u)\implies \frac{f'(u)}{f(u)}=1$

with one last integration we get:

l o g [f (u)] = u + c ⟹ f (u) = k e^{u}

$log[f(u)] = u + c \implies f(u) = k \,e^u$

We know that the expectation that drawing a sample from the uniform distribution and surpassing $0$ is $1$ , or $f(0) = 1$ . Hence, $k = 1$ , and $f(u)=e^u$ . Therefore $f(1) = e.$

— Antoni Parellada
fonte

I do like the manner in which this generalises the result.

— Silverfish