Rompicapo: Qual è la lunghezza attesa di una sequenza iid che sta aumentando monotonicamente quando viene attinto da una distribuzione uniforme [0,1]?


28

Questa è una domanda di intervista per una posizione di analista quantitativa, riportata qui . Supponiamo che stiamo attingendo da una distribuzione uniforme [0,1] e che i disegni siano iid, qual è la lunghezza prevista di una distribuzione monotonicamente crescente? Cioè, smettiamo di disegnare se il sorteggio corrente è minore o uguale al sorteggio precedente.

Ho ottenuto i primi:

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

ma trovo il calcolo di questi integrali nidificati sempre più difficile e non sto ottenendo il "trucco" per generalizzare a Pr(length=n) . So che la risposta finale è strutturata

E(length)=n=1nPr(length=n)

Qualche idea su come rispondere a questa domanda?

Risposte:


37

Ecco alcuni suggerimenti generali per risolvere questa domanda:

Hai una sequenza di variabili casuali IID continue, il che significa che sono scambiabili . Che cosa implica questo sulla probabilità di ottenere un ordine particolare per i primi n valori? Sulla base di ciò, qual è la probabilità di ottenere un ordine crescente per i primi n valori? È possibile capirlo senza integrarsi sulla distribuzione delle variabili casuali sottostanti. Se lo fai bene, sarai in grado di ricavare una risposta senza l'assunzione di una distribuzione uniforme - vale a dire, otterrai una risposta che si applica per eventuali sequenze intercambiabili di variabili casuali continue.


Ecco la soluzione completa ( non guardare se dovresti capirlo da solo ):

Consenti a essere la sequenza di variabili casuali continue indipendenti e lascia che il numero di elementi crescenti all'inizio della sequenza. Poiché si tratta di variabili casuali intercambiabili continue, sono quasi sicuramente ineguali tra loro e qualsiasi ordinamento è ugualmente probabile, quindi abbiamo: (Si noti che questo risultato vale per qualsiasi sequenza IID di variabili casuali continue; non devono avere una distribuzione uniforme.) Quindi la variabile casuale ha una funzione di massa di probabilitàU1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}

P(Nn)=P(U1<U2<<Un)=1n!.
N
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
Noterai che questo risultato è in accordo con i valori che hai calcolato usando l'integrazione sui valori sottostanti. (Questa parte non è necessaria per la soluzione; è inclusa per completezza.) Usando una regola ben nota per il valore atteso di una variabile casuale non negativa , abbiamo: Notare ancora che non c'è nulla nel nostro lavoro che abbia utilizzato la distribuzione uniforme sottostante. Quindi, questo è un risultato generale che si applica a qualsiasi sequenza intercambiabile di variabili casuali continue.
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

Alcuni approfondimenti:

Da quanto detto sopra vediamo che questo risultato distributivo e il risultante valore atteso non dipendono dalla distribuzione sottostante, purché si tratti di una distribuzione continua. Questo non è davvero sorprendente se consideriamo il fatto che ogni variabile casuale scalare continua può essere ottenuta tramite una trasformazione monotonica di una variabile casuale uniforme (con la trasformazione come sua funzione quantile). Poiché le trasformazioni monotoniche preservano l'ordine di rango, esaminare le probabilità degli ordinamenti di variabili casuali continue IID arbitrarie equivale a guardare le probabilità degli ordinamenti di variabili casuali uniformi IID .


6
Ben fatto! (+1)
jbowman,

1
@Ben Ti seguo fino all'ultima equazione ... Pensavo che il valore atteso fosse, piuttosto che ... puoi spiegare di più questa parte?
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
Amazzonia,

5
Questa è una regola ben nota per il valore atteso di una variabile casuale non negativa . Usando una tecnica che prevede lo scambio dell'ordine delle sommazioni, hai: Quindi dovresti trovare che .
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
Ripristina Monica il

Puoi per favore spiegare perché ? P(Nn)=P(U1<U2<<Un)
badmax

1
@badmax: la variabile casuale è il numero di elementi crescenti di all'inizio della sequenza (vedere la sua definizione). Pertanto, se significa che ci sono almeno elementi crescenti all'inizio della sequenza. Ciò significa che i primi elementi devono essere in ordine crescente, ovvero . NUNnnnU1<U2<<Un
Ripristina Monica il

8

Un altro metodo di risoluzione che ti offre la soluzione per un caso più generale.

Supponiamo che sia la lunghezza prevista di una sequenza monotonica , tale che . Il valore che vogliamo calcolare è . E sappiamo che . Condizionamento sul valore successivo,F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

dove è la densità U [0,1]. Cosìπ(y)=1

F(x)=(1+F(x))

Risolvendo con la condizione al contorno , otteniamo . Quindi .F(1)=0F(x)=e(1x)1F(0)=e1


2
Questo è molto intelligente. Giusto per spiegarlo un po ': le tue osservazioni sono che 1) se è la lunghezza della sequenza crescente iniziale più lunga meno una, allora è sufficiente determinare e impostare e 2) è zero se e altrimenti. Poiché otteniamo , che nel caso uniforme possono essere risolti direttamente. LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=y)y<x1+E(L|X0=y)E(L|X0=x)=E(E(L|X0=x,X1))=RfX(y)E(L|X0=x,X1=y)dy=x1fX(y)(1+E(L|X0=y))dy=x1fX(y)(1+F(y))dyF(x)=fX(x)(1+F(x))
Matthew Towers,

2
+1 Davvero molto intelligente. Ma poiché la risposta finale non dipende dalla distribuzione (come discute dall'altra risposta), anche questo calcolo non dovrebbe in qualche modo dipendere da . C'è un modo per vederlo? CC a @m_t_. π(y)
ameba dice Reinstate Monica il

3
@amoeba Sono d'accordo che non dovrebbe dipendere dalla distribuzione degli s, ma altri valori di dovrebbero: la soluzione generale di quel DE èF(0)XFF=Ceπ1
Matthew Towers

1
@MartijnWeterings Penso che , non 1, ad esempio nel caso uniforme otteniamoC=eeex1
Matthew Towers

1
Si hai ragione. Ho usato il caso uniforme per dedurre la mia affermazione, ma ho usato falsamente invece dice1x1cex1
Sesto Empirico

0

Un altro metodo di risoluzione è calcolare direttamente l'integrale.

La probabilità di generare una sequenza la cui parte crescente ha una lunghezza di è , dove .nfn(0)fn(x)=x1x11x21...xn21xn11dxndxn1...dx2dx1

Quello che dobbiamo fare è calcolare .fn(0)

Se provi a calcolare i primi diversi , forse troverai chefn(x)fn(x)=t=0n(x)tt!(nt)!

Caso base: quando ,n=1f1(x)=t=01(x)tt!(nt)!=1x=x1dx1

Ipotesi induttiva: quando ,n=kfn(x)=t=0k(x)tt!(kt)! , for k1

Passo induttivo: quando ,n=k+1

     fn(x)=fk+1(x)=x1fk(x)dx

=x1t=0k(x)tt!(kt)!dx

=t=0k(x)t+1t!(kt)!×(t+1)|x1=t=0k(x)t+1(t+1)!(kt)!|x1

=t=1k+1(x)tt!(kt+1)!|x1

=t=1k+1(1)t+1t!(kt+1)!+t=1k+1(x)tt!(kt+1)!

=t=1k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!+t=0k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!(11)k+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=t=0k+1(x)tt!(kt+1)!

Per Mathematical Induction, il presupposto vale.

Quindi, otteniamo chefn(0)=1n!

Quindi,E(length)=n=1Pr(lengthn)=n=11n!=e1

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.