Con le informazioni fornite da @Glen_b sono riuscito a trovare la risposta. Usando le stesse notazioni della domanda
P( ZK≤ x ) = ∑j = 0k + 1( k+1j) (-1)j( 1 - j x )K+,
dove se e altrimenti. Do anche l'attesa e la convergenza asintotica alla distribuzione di Gumbel ( NB : non Beta)a > 0 0a+=aa>00
E(Zk)=1k+1∑i=1k+11i∼log(k+1)k+1,P(Zk≤x)∼exp(−e−(k+1)x+log(k+1)).
Il materiale delle prove è tratto da diverse pubblicazioni collegate nei riferimenti. Sono piuttosto lunghi, ma semplici.
1. Prova dell'esatta distribuzione
Sia variabili variabili casuali IID nell'intervallo . Ordinandoli, otteniamo le statistiche dell'ordine indicate . Le spaziature uniformi sono definite come , con e . Le spaziature ordinate sono le corrispondenti statistiche ordinate . La variabile di interesse è .( 0 , 1 ) k ( U ( 1 ) , … , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 ) ≤(U1,…,Uk)(0,1)k(U(1),…,U(k))Δi=U(i)−U(i−1)U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)≤…≤Δ(k+1)Δ(k+1)
Per fisso , definiamo la variabile indicatore . Per simmetria, il vettore casuale è scambiabile, quindi la distribuzione congiunta di un sottoinsieme di dimensione è la stessa della distribuzione congiunta di il primo . Espandendo il prodotto, otteniamo così1 i = 1 { Δ i > x } ( 1 1 , … , 1 k + 1 ) j jx∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj
P(Δ(k+1)≤x)=E(∏i=1k+1(1−1i))=1+∑j=1k+1(k+1j)(−1)jE(∏i=1j1i).
Dimostreremo ora che , che stabilirà la distribuzione sopra indicata. Lo dimostriamo per , poiché il caso generale è dimostrato in modo simile. j = 2E(∏ji=11i)=(1−jx)k+j=2
E( ∏i = 121io) =P( Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
Se , i punti di interruzione sono nell'intervallo . In base a questo evento, i punti di interruzione sono ancora scambiabili, quindi la probabilità che la distanza tra il secondo e il primo punto di interruzione sia maggiore di è uguale alla probabilità che la distanza tra il primo punto di interruzione e la barriera sinistra (nella posizione ) è maggiore di . Cosìk ( x , 1 ) x x xΔ1>xk(x,1)xxx
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. Aspettativa
Per le distribuzioni con supporto finito, abbiamo
E( X) = ∫P( X> x ) dx = 1 - ∫P( X≤ x ) dx .
Integrando la distribuzione di , otteniamoΔ( k + 1 )
E( Δ( k + 1 )) = 1k + 1Σj = 1k + 1( k+1j) (-1)j + 1j= 1k + 1Σj = 1k + 11j.
L'ultima uguaglianza è una rappresentazione classica dei numeri armonici , che dimostriamo di seguito.Hio= 1 + 12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
Con il cambio della variabile e l'espansione del prodotto, otteniamou=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. Costruzione alternativa di spaziature uniformi
Per ottenere la distribuzione asintotica del frammento più grande, dovremo esibire una costruzione classica di spaziature uniformi come variabili esponenziali divise per la loro somma. La densità di probabilità delle statistiche dell'ordine associate è(U(1),…,U(k))
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
Se denotiamo le spaziature uniformi , con , otteniamoΔi=U(i)−U(i−1)U(0)=0
fΔ1,…Δk(δ1,…,δk)=k!,0≤δi+…+δk≤1.
Definendo , otteniamo cosìU(k+1)=1
fΔ1,…Δk+1(δ1,…,δk+1)=k!,δ1+…+δk=1.
Ora, supponiamo che siano variabili casuali esponenziali IID con media 1 e che . Con un semplice cambio di variabile, possiamo vederlo(X1,…,Xk+1)S=X1+…+Xk+1
fX1,…Xk,S(x1,…,xk,s)=e−s.
Definire , in modo tale da ottenere una variazione della variabileYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
Integrando questa densità rispetto a , otteniamo cosìs
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1)=k!,y1+…+yk+1=1.
Quindi la distribuzione congiunta di spaziature uniformi sull'intervallo è la stessa della distribuzione congiunta di variabili casuali esponenziali divise per la loro somma. Veniamo alla seguente equivalenza di distribuzionek+1(0,1)k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. Distribuzione asintotica
Usando l'equivalenza sopra, otteniamo
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
dove . Questa variabile svanisce nella probabilità perché e . Asintoticamente, la distribuzione è la stessa di . Perché sono IID, abbiamoTk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0X(k+1)−log(k+1)Xi
P(X(k+1)−log(k+1)≤x)=P(X1≤x+log(k+1))k+1=(1−e−x−log(k+1))k+1=(1−e−xk+1)k+1∼exp{−e−x}.
5. Panoramica grafica
Il diagramma seguente mostra la distribuzione del frammento più grande per diversi valori di . Per , ho anche sovrapposto la distribuzione asintotica di Gumbel (linea sottile). Il Gumbel è una pessima approssimazione per piccoli valori di quindi li ometto per non sovraccaricare l'immagine. L'approssimazione di Gumbel è buona da .kk=10,20,50kk ≈ 50
6. Riferimenti
Le prove di cui sopra sono tratte dai riferimenti 2 e 3. La letteratura citata contiene molti più risultati, come la distribuzione delle spaziature ordinate di qualsiasi rango, la loro distribuzione limite e alcune costruzioni alternative delle spaziature uniformi ordinate. I riferimenti chiave non sono facilmente accessibili, quindi fornisco anche collegamenti al testo completo.
- Bairamov et al. (2010) Limita i risultati per le spaziature uniformi ordinate , Stat paper, 51: 1, pp 227-240
- Holst (1980) Sulla lunghezza dei pezzi di un bastone spezzati a caso , J. Appl. Prob., 17, pp 623-634
- Pyke (1965) spaziature , JRSS (B). 27: 3, pp 395-449
- Renyi (1953) Sulla teoria delle statistiche dell'ordine , Acta math Hung, 4, pp 191-231