Aspettativa di un prodotto di variabili casuali dipendenti quando


18

Lasciate e , . Qual è l'aspettativa di come ?X1U[0,1]XiU[Xi1,1]i=2,3,... n X1X2Xnn


7
Un'osservazione pedante: intende ? In alternativa, potrebbe significare condizionamento solo su , ovvero . Ma poiché quest'ultimo non specifica completamente la distribuzione congiunta di , non è immediatamente chiaro se l'aspettativa sia determinata in modo univoco. XiU[Xi1,1]XiX1,,Xi1U[Xi1,1]Xi1XiXi1U[Xi1,1]Xi
Juho Kokkala,

Penso che teoricamente dovrebbe essere condizionato su tutti i precedenti fino a . Tuttavia, dato possiamo ottenere la distribuzione per . Quindi non ne sono del tutto sicuro. XiXi1Xi1Xi
Usato da chi il

@JuhoKokkala Come detto, non importa se si condizionano le variabili prima di perché non cambierebbero il fatto che è uniforme . La distribuzione di sembra perfettamente definita. Xi1Xi[Xi1,1](X1,,Xn)
Dsaxton,

@dsaxton Se noi assumiamo solo e , è rimane possibile che e non siano condizionatamente indipendenti da . Pertanto, la distribuzione di non è ben definita. X1U(0,1)XiXi1U(Xi1,1),i=2,3,...X1X3X2(X1,X2,X3)
Juho Kokkala,

@JuhoKokkala Se ti dico che , qual è la distribuzione di ? Se puoi rispondere alla domanda senza nemmeno pensare a , in che modo e possono dipendere da ? Nota anche come altri poster non abbiano avuto problemi a simulare questa sequenza. X2=tX3X1X1X3X2
Dsaxton,

Risposte:


12

La risposta è effettivamente ,1/e come indovinato nelle risposte precedenti basate su simulazioni e approssimazioni finite.

La soluzione è facilmente raggiungibile introducendo una sequenza di funzioni . Anche se potremmo procedere immediatamente a questo passaggio, potrebbe sembrare piuttosto misterioso. La prima parte di questa soluzione spiega come si potrebbero preparare questi . La seconda parte mostra come vengono sfruttate per trovare un'equazione funzionale soddisfatta dalla funzione limitante . La terza parte mostra i calcoli (di routine) necessari per risolvere questa equazione funzionale.fn:[0,1][0,1]fn(t)f(t)=limnfn(t)


1. Motivazione

Possiamo arrivare a questo applicando alcune tecniche matematiche standard di risoluzione dei problemi. In questo caso, dove si ripete all'infinito un qualche tipo di operazione , il limite esisterà come punto fisso di tale operazione. La chiave, quindi, è identificare l'operazione.

La difficoltà è che il passaggio da a sembra complicato. È più semplice visualizzare questo passaggio come derivante dall'adiacente alle variabili piuttosto che adiacente alle variabili . Se dovessimo considerare come costruito come descritto nella domanda - con distribuito uniformemente su , distribuito in modo condizionale uniformemente su e così via-- quindi introducendoE [ X 1 X 2X n - 1 X n ] X 1 ( X 2 , , X n ) X n ( X 1 , X 2 , , X n - 1 ) ( X 2 , , X nE[X1X2Xn1]E[X1X2Xn1Xn]X1(X2,,Xn)Xn(X1,X2,,Xn1)X 2 [ 0 , 1 ] X 3 [ X 2 , 1 ] X 1 X i 1 - X 1 1(X2,,Xn)X2[0,1]X3[X2,1]X1farà sì che ciascuno degli successivi si di un fattore verso il limite superiore . Questo ragionamento porta naturalmente alla seguente costruzione.Xi1X11

In via preliminare, dal momento che è un po 'più semplice ridurre i numeri verso rispetto a , sia . Pertanto, è distribuito uniformemente in e è distribuito uniformemente in base a per tutti Siamo interessati a due cose:1 Y i = 1 - X i Y 1 [ 0 , 1 ] Y i + 1 [ 0 , Y i ] ( Y 1 , Y 2 , , Y i ) i = 1 , 2 , 3 , .01Yi=1XiY1[0,1]Yi+1[0,Yi](Y1,Y2,,Yi)i=1,2,3,.

  1. Il valore limite di .E[X1X2Xn]=E[(1Y1)(1Y2)(1Yn)]

  2. Come si comportano questi valori quando si restringe tutto uniformemente verso : cioè, ridimensionandoli tutti di un fattore comune , . 0 t 0 t 1Yi0t0t1

A tal fine, definire

fn(t)=E[(1tY1)(1tY2)(1tYn)].

Chiaramente ogni è definito e continuo (infinitamente differenziabile, in realtà) per tutte le reali . Ci concentreremo sul loro comportamento per . t t [ 0 , 1 ]fntt[0,1]


2. Il passaggio chiave

Sono ovvi:

  1. Ogni è una funzione monotonicamente decrescente da a .[ 0 , 1 ] [ 0 , 1 ]fn(t)[0,1][0,1]

  2. nfn(t)>fn+1(t) per tutti .n

  3. nfn(0)=1 per tutto .n

  4. E(X1X2Xn)=fn(1).

Ciò implica che esiste per tutti e .t [ 0 , 1 ] f ( 0 ) = 1f(t)=limnfn(t)t[0,1]f(0)=1

Si che, subordinatamente a , la variabile è uniforme in e le variabili (subordinata a tutte le variabili precedenti) sono uniformi in : ovvero , soddisfano esattamente le condizioni soddisfatte da . conseguentementeY 2 / Y 1 [ 0 , 1 ] Y i + 1 / Y 1 [ 0 , Y i / Y 1 ] ( Y 2 / Y 1 , Y 3 / Y 1 , , Y n / Y 1 ) ( Y 1 , , Y n - 1 )Y1Y2/Y1[0,1]Yi+1/Y1[0,Yi/Y1](Y2/Y1,Y3/Y1,,Yn/Y1)(Y1,,Yn1)

fn(t)=E[(1tY1)E[(1tY2)(1tYn)|Y1]]=E[(1tY1)E[(1tY1Y2Y1)(1tY1YnY1)|Y1]]=E[(1tY1)fn1(tY1)].

Questa è la relazione ricorsiva che stavamo cercando.

Nel limite da deve quindi essere il caso che per distribuito uniformemente in indipendentemente da tutto ,Y [ 0 , 1 ] Y inY[0,1]Yi

f(t)=E[(1tY)f(tY)]=01(1ty)f(ty)dy=1t0t(1x)f(x)dx.

Cioè, deve essere un punto fisso del funzionale per il qualeLfL

L[g](t)=1t0t(1x)g(x)dx.

3. Calcolo della soluzione

Cancella la frazione moltiplicando entrambi i lati per . Poiché il lato destro è un integrale, possiamo differenziarlo rispetto a , il daret t1/ttt

f(t)+tf(t)=(1t)f(t).

Equivalentemente, sottraendo e dividendo entrambi i lati per ,tf(t)t

f(t)=f(t)

per . Possiamo estenderlo per continuità per includere . Con la condizione iniziale (3) , la soluzione unica èt = 0 f ( 0 ) = 10<t1t=0f(0)=1

f(t)=et.

Di conseguenza, per (4), l'aspettativa limite di è , QED. f ( 1 ) = e - 1 = 1 / eX1X2Xnf(1)=e1=1/e


Poiché Mathematica sembra essere uno strumento popolare per studiare questo problema, ecco il codice Mathematica per calcolare e tracciare per il piccolo . Il diagramma di mostra una rapida convergenza verso (mostrato come grafico nero). n f 1 , f 2 , f 3 , f 4 e - tfnnf1,f2,f3,f4et

a = 0 <= t <= 1;
l[g_] := Function[{t}, (1/t) Integrate[(1 - x) g[x], {x, 0, t}, Assumptions -> a]];
f = Evaluate@Through[NestList[l, 1 - #/2 &, 3][t]]
Plot[f, {t,0,1}]

figura


3
(+1) Bella analisi.
cardinale il

Grazie per averlo condiviso con noi. Ci sono persone davvero brillanti là fuori!
Felipe Gerard,

4

Aggiornare

Penso che sia una scommessa sicura che la risposta sia . Ho eseguito gli integrali per il valore atteso da a usando Mathematica e con ho ottenuton = 2 n = 100 n = 1001/en=2n=100n=100

0.367879441171442321595523770161567628159853507344458757185018968311538556667710938369307469618599737077005261635286940285462842065735614

(fino a 100 cifre decimali). Il reciproco di quel valore è

2.718281828459045235360287471351873636852026081893477137766637293458245150821149822195768231483133554

La differenza con quella reciproca ed èe

-7.88860905221011806482437200330334265831479532397772375613947042032873*10^-31

Penso che sia troppo vicino, oserei dire, per essere una coincidenza razionale.

Il codice Mathematica segue:

Do[
 x = Table[ToExpression["x" <> ToString[i]], {i, n}];
 integrand = Expand[Simplify[(x[[n - 1]]/(1 - x[[n - 1]])) Integrate[x[[n]], {x[[n]], x[[n - 1]], 1}]]];
 Do[
   integrand = Expand[Simplify[x[[i - 1]] Integrate[integrand, {x[[i]], x[[i - 1]], 1}]/(1 - x[[i - 1]])]],
   {i, n - 1, 2, -1}]
  Print[{n, N[Integrate[integrand, {x1, 0, 1}], 100]}],
 {n, 2, 100}]

Fine dell'aggiornamento

Questo è più un commento esteso che una risposta.

Se seguiamo un percorso di forza bruta determinando il valore atteso per diversi valori di , forse qualcuno riconoscerà un modello e sarà quindi in grado di prendere un limite.n

Per , abbiamo il valore atteso del prodotton=5

μn=01x11x21x31x41x1x2x3x4x5(1x1)(1x2)(1x3)(1x4)dx5dx4dx3dx2dx1

che è 96547/259200 o circa 0,3724807098765432.

Se trasciniamo l'integrale da 0 a 1, abbiamo un polinomio in con i seguenti risultati per a (e ho lasciato cadere il pedice per rendere le cose un po 'più facili da leggere): n = 1 n = 6x1n=1n=6

x

(x+x2)/2

(5x+5x2+2x3)/12

(28x+28x2+13x3+3x4)/72

(1631x+1631x2+791x3+231x4+36x5)/4320

(96547x+96547x2+47617x3+14997x4+3132x5+360x6)/259200

Se qualcuno riconosce la forma dei coefficienti interi, allora può essere determinato un limite come (dopo aver eseguito l'integrazione da 0 a 1 che è stata rimossa per mostrare il polinomio sottostante).n


1/e è meravigliosamente elegante! :)
wolfies il

4

Bella domanda Proprio come un breve commento, vorrei notare che:

  • Xn converge rapidamente in 1, quindi per il controllo Monte Carlo, l'impostazione sarà più che semplice.n=1000

  • Se , quindi mediante simulazione Monte Carlo, come , .Zn=X1X2XnnE[Zn]0.367

  • Il diagramma seguente confronta il pdf Monte Carlo simulato di con una distribuzione della funzione di potenza [cioè un beta (a, 1) pdf)]Zn

f(z)=aza1

... qui con il parametro :a=0.57


(fonte: tri.org.au )

dove:

  • la curva blu indica il pdf "empirico" di Monte Carlo diZn
  • la curva tratteggiata rossa è un pdf PowerFunction.

La vestibilità sembra abbastanza buona.

Codice

Ecco 1 milione di disegni pseudocasuali del prodotto (diciamo con ), qui usando Mathematica :Znn=1000

data = Table[Times @@ NestList[RandomReal[{#, 1}] &, RandomReal[], 1000], {10^6}];

La media del campione è:

 Mean[data]

0.367657


puoi condividere l'intero codice? La mia soluzione differisce dalla tua.

1
Il primo punto elenco, che è cruciale, non sembra sufficientemente giustificato. Perché puoi eliminare l'effetto, diciamo, dei prossimi valori di ? Nonostante la "rapida" convergenza, il loro effetto cumulativo potrebbe ridurre considerevolmente le aspettative. x n10100xn
whuber

1
Buon uso della simulazione qui. Ho domande simili a @whuber. Come possiamo essere sicuri che il valore converga a 0,367 ma non a qualcosa di più basso, che è potenzialmente possibile se è più grande? n
Usato da chi il

In risposta ai precedenti 2 commenti: (a) La serie converge molto rapidamente in 1. Anche a partire da un valore iniziale di , entro circa 60 iterazioni, sarà numericamente indistinguibile da 1,0 numerico a un computer . Quindi, simulare con è eccessivo. (b) Come parte del test di Monte Carlo, ho anche controllato la stessa simulazione (con 1 milione di esecuzioni) ma usando anziché 1000 e i risultati erano indistinguibili. Pertanto, sembra improbabile che valori più grandi di possano fare una differenza evidente: sopra , è effettivamente 1.0.X 1 = 0,1 X 60 X n n = 1000 n = 5000 n n = 100 X nXiX1=0.1X60Xnn=1000n=5000nn=100Xn
Lupi il

0

Puramente intuitivamente, e basato sull'altra risposta di Rusty, penso che la risposta dovrebbe essere qualcosa del genere:

n = 1:1000
x = (1 + (n^2 - 1)/(n^2)) / 2
prod(x)

Che ci dà 0.3583668. Per ogni , stai dividendo l' intervallo a metà, dove inizia da . Quindi è un prodotto di , ecc.( un , 1 ) un 0 1 / 2 , ( 1 + 3 / 4 ) / 2 , ( 1 + 8 / 9 ) / 2X(a,1)a01/2,(1+3/4)/2,(1+8/9)/2

Questa è solo intuizione.


Il problema con la risposta di Rusty è che U [1] è identico in ogni singola simulazione. Le simulazioni non sono indipendenti. Una soluzione per questo è facile. Sposta la linea U[1] = runif(1,0,1)all'interno del primo anello. Il risultato è:

set.seed(3)    #Just for reproducibility of my solution

n = 1000    #Number of random variables
S = 1000    #Number of Monte Carlo samples

Z = rep(NA,S)
U = rep(NA,n)

for(j in 1:S){
    U[1] = runif(1,0,1)
    for(i in 2:n){
        U[i] = runif(1,U[i-1],1)
    }
    Z[j] = prod(U)
}

mean(Z)

Questo dà 0.3545284.


1
Correzione molto semplice! Immagino sia vero, c'è sempre un bug nel codice! Abbasso la mia risposta.

1
Sì, era esattamente quello che mi aspettavo accadesse dato che hai inserito i valori previsti come limiti inferiori.

1
S=100000.3631297
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.