Distribuzione del più grande frammento di un bastone rotto (spaziature)


21

Lascia che un bastoncino di lunghezza 1 sia rotto in frammenti uniformemente a caso. Qual è la distribuzione della lunghezza del frammento più lungo?k+1

Più formalmente, let sia IID e let siano le statistiche dell'ordine associate, ovvero ordiniamo semplicemente l'esempio in modo tale che . Lascia che .(U1,Uk)U(0,1)(U(1),,U(k))U(1)U(2),,U(k)Zk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

Sono interessato alla distribuzione di Zk . Sono anche interessanti momenti, risultati asintotici o approssimazioni per k .


9
Questo è un problema ben studiato; vedi R. Pyke (1965), " Distanze ", JRSS (B) 27 : 3, pp. 395-449. Proverò a tornare per aggiungere alcune informazioni in seguito, a meno che qualcuno non mi picchi. C'è anche un articolo del 1972 dello stesso autore (" Spacings rivisitato ") ma penso che ciò che cerchi sia praticamente tutto nel primo. Ci sono alcuni asintotici in Devroye (1981) , "Le leggi del logaritmo iterato per le statistiche degli ordini delle distanze uniformi" Ann. Probab. , 9 : 5, 860-867.
Glen_b

4
Questi dovrebbero anche dare alcuni buoni termini di ricerca per trovare lavoro successivo se ne hai bisogno.
Glen_b

3
Questo e spettacolare. Il primo riferimento è difficile da trovare. Per chi fosse interessato, l'ho messo su The Grand Locus .
gui11aume,

Correggere l'errore di stampa: anziché . U ( k )Y(k)U(k)
Viktor,

Grazie @Viktor! Per cose così piccole, non esitate a fare la modifica da soli (penso che sarà esaminata da altri utenti per l'approvazione).
gui11aume,

Risposte:


18

Con le informazioni fornite da @Glen_b sono riuscito a trovare la risposta. Usando le stesse notazioni della domanda

P(ZKX)=Σj=0K+1(K+1j)(-1)j(1-jX)+K,

dove se e altrimenti. Do anche l'attesa e la convergenza asintotica alla distribuzione di Gumbel ( NB : non Beta)a > 0 0un'+=un'un'>00

E(ZK)=1K+1Σio=1K+11io~log(K+1)K+1,P(ZKX)~exp(-e-(K+1)X+log(K+1)).

Il materiale delle prove è tratto da diverse pubblicazioni collegate nei riferimenti. Sono piuttosto lunghi, ma semplici.

1. Prova dell'esatta distribuzione

Sia variabili variabili casuali IID nell'intervallo . Ordinandoli, otteniamo le statistiche dell'ordine indicate . Le spaziature uniformi sono definite come , con e . Le spaziature ordinate sono le corrispondenti statistiche ordinate . La variabile di interesse è .( 0 , 1 ) k ( U ( 1 ) , , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 )(U1,...,UK)(0,1)K(U(1),...,U(K))Δio=U(io)-U(io-1)U(0)=0U(K+1)=1 Δ ( k + 1 )Δ(1)...Δ(K+1)Δ(k+1)

Per fisso , definiamo la variabile indicatore . Per simmetria, il vettore casuale è scambiabile, quindi la distribuzione congiunta di un sottoinsieme di dimensione è la stessa della distribuzione congiunta di il primo . Espandendo il prodotto, otteniamo così1 i = 1 { Δ i > x } ( 1 1 , , 1 k + 1 ) j jx(0,1)1i=1{Δi>x}(11,,1k+1)jj

P(Δ(k+1)x)=E(i=1k+1(11i))=1+j=1k+1(k+1j)(1)jE(i=1j1i).

Dimostreremo ora che , che stabilirà la distribuzione sopra indicata. Lo dimostriamo per , poiché il caso generale è dimostrato in modo simile. j = 2E(i=1j1i)=(1jx)+kj=2

E(i=121i)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

Se , i punti di interruzione sono nell'intervallo . In base a questo evento, i punti di interruzione sono ancora scambiabili, quindi la probabilità che la distanza tra il secondo e il primo punto di interruzione sia maggiore di è uguale alla probabilità che la distanza tra il primo punto di interruzione e la barriera sinistra (nella posizione ) è maggiore di . Cosìk ( x , 1 ) x x xΔ1>xk(x,1)xxx

P(Δ2>x|Δ1>x)=P(all points are in (2x,1)|all points are in (x,1)),soP(Δ2>xΔ1>x)=P(all points are in (2x,1))=(12X)+K.

2. Aspettativa

Per le distribuzioni con supporto finito, abbiamo

E(X)=P(X>X)dX=1-P(XX)dX.

Integrando la distribuzione di , otteniamoΔ(K+1)

E(Δ(K+1))=1K+1Σj=1K+1(K+1j)(-1)j+1j=1K+1Σj=1K+11j.

L'ultima uguaglianza è una rappresentazione classica dei numeri armonici , che dimostriamo di seguito.Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

Con il cambio della variabile e l'espansione del prodotto, otteniamou=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Costruzione alternativa di spaziature uniformi

Per ottenere la distribuzione asintotica del frammento più grande, dovremo esibire una costruzione classica di spaziature uniformi come variabili esponenziali divise per la loro somma. La densità di probabilità delle statistiche dell'ordine associate è(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Se denotiamo le spaziature uniformi , con , otteniamoΔi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

Definendo , otteniamo cosìU(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Ora, supponiamo che siano variabili casuali esponenziali IID con media 1 e che . Con un semplice cambio di variabile, possiamo vederlo(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

Definire , in modo tale da ottenere una variazione della variabileYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

Integrando questa densità rispetto a , otteniamo cosìs

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

Quindi la distribuzione congiunta di spaziature uniformi sull'intervallo è la stessa della distribuzione congiunta di variabili casuali esponenziali divise per la loro somma. Veniamo alla seguente equivalenza di distribuzionek+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. Distribuzione asintotica

Usando l'equivalenza sopra, otteniamo

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

dove . Questa variabile svanisce nella probabilità perché e . Asintoticamente, la distribuzione è la stessa di . Perché sono IID, abbiamoTk+1=X1++Xk+1k+11E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+10X(k+1)log(k+1)Xi

P(X(k+1)log(k+1)x)=P(X1x+log(k+1))k+1=(1exlog(k+1))k+1=(1exk+1)k+1exp{ex}.

5. Panoramica grafica

Il diagramma seguente mostra la distribuzione del frammento più grande per diversi valori di . Per , ho anche sovrapposto la distribuzione asintotica di Gumbel (linea sottile). Il Gumbel è una pessima approssimazione per piccoli valori di quindi li ometto per non sovraccaricare l'immagine. L'approssimazione di Gumbel è buona da .kk=10,20,50kK50

Distribuzione del più grande frammento di un bastone rotto

6. Riferimenti

Le prove di cui sopra sono tratte dai riferimenti 2 e 3. La letteratura citata contiene molti più risultati, come la distribuzione delle spaziature ordinate di qualsiasi rango, la loro distribuzione limite e alcune costruzioni alternative delle spaziature uniformi ordinate. I riferimenti chiave non sono facilmente accessibili, quindi fornisco anche collegamenti al testo completo.

  1. Bairamov et al. (2010) Limita i risultati per le spaziature uniformi ordinate , Stat paper, 51: 1, pp 227-240
  2. Holst (1980) Sulla lunghezza dei pezzi di un bastone spezzati a caso , J. Appl. Prob., 17, pp 623-634
  3. Pyke (1965) spaziature , JRSS (B). 27: 3, pp 395-449
  4. Renyi (1953) Sulla teoria delle statistiche dell'ordine , Acta math Hung, 4, pp 191-231

Brillante. A proposito, esiste un asintotico noto a ? E(ZK2)
Amir Sagiv,

@AmirSagiv questa è una buona domanda. Ho dato una rapida occhiata ai riferimenti e non sono riuscito a trovarli. Inoltre non ho potuto adattare la prova di cui sopra. Questo mi ha fatto capire che non so quale sia la distribuzione di un quadrato di un Gumbel. Forse un buon punto di partenza?
gui11aume,

1
$ gui11aume Guarda qui: mathoverflow.net/a/293381/42864
Amir Sagiv

1
@AmirSagiv Questo è un ottimo post. Per qualche ragione, ho frainteso la tua domanda e ho pensato che fossi interessato alla distribuzione asintotica di (anche se il tuo commento era molto chiaro), quindi il mio commento sopra non è così rilevante. ZK2
gui11aume,

3

Questa non è una risposta completa, ma ho fatto alcune simulazioni rapide, ed è quello che ho ottenuto: Istogramma del frammento più lungo

Sembra notevolmente beta-ish e questo ha un po 'di senso, dal momento che le statistiche dell'ordine delle distribuzioni uniformi iid sono beta wiki .

Questo potrebbe dare un punto di partenza per derivare il pdf risultante.

Aggiornerò se arrivo a una soluzione chiusa finale.

Saluti!


Ancora un'altra cosa, la forma dell'istogramma per aumentare k non cambia considerevolmente, a parte il fatto di essere "schiacciata" vicino a 0.
Lima

1
Grazie per i tuoi pensieri @Lima (e benvenuti a Cross Validated). Penso che la tua risposta possa essere migliorata. In primo luogo, mi asterrei dal fare dichiarazioni senza prove. Se ciò non è corretto, puoi mettere le persone che vedono questa discussione sulla strada sbagliata. Secondo, documenterei quello che hai fatto. Senza il valore di che hai usato né il codice, la figura non aiuta nessuno. Infine, vorrei copiare e modificare la risposta e rimuovere tutto ciò che non risponde direttamente alla domanda. K
gui11aume,

1
Grazie per i suggerimenti Sono validi oltre lo scambio di stack e mi ricorderò di usarli.
Lima,

1

Ho prodotto la risposta per una conferenza a Siena (Italia) nel 2005. Il documento (2006) è presentato sul mio sito web qui (pdf) . Le distribuzioni esatte di tutte le distanze (dal più piccolo al più grande) sono riportate alle pagine 75 e 76.

Spero di fare una presentazione su questo argomento alla Conferenza RSS a Manchester (Inghilterra) a settembre 2016.


2
Benvenuti nel sito. Stiamo cercando di creare un archivio permanente di informazioni statistiche di alta qualità sotto forma di domande e risposte. Pertanto, siamo diffidenti nei confronti delle risposte solo link, a causa di linkrot. Puoi pubblicare una citazione completa e un riepilogo delle informazioni al link, nel caso in cui vada a mancare? Inoltre, per favore non firmare i tuoi post qui. Ogni post ha un link alla tua pagina utente dove puoi pubblicare quelle informazioni.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.