Come si calcola la funzione di densità di probabilità del massimo di un campione di variabili casuali uniformi IID?


45

Data la variabile casuale

Y=max(X1,X2,,Xn)

dove Xi sono variabili uniformi IID, come posso calcolare il PDF di Y ?


4
Se si tratta di compiti a casa, leggi le FAQ e aggiorna la tua domanda di conseguenza.
cardinale il

Si può usare l'identità di Vandermonde per mostrare la funzione congiunta delle statistiche del 2 ordine dire F_y (r) * G_y (r)?
Larry Mintz,

Per interesse, quale corso copre questo tipo di problema? Non è qualcosa che ho incontrato nel mio corso di probabilità di ingegneria.
Alex,

@Alex Che ne pensi di un corso di statistica che copre il ricampionamento?
SOFe

Risposte:


65

È possibile che questa domanda sia un compito da svolgere, ma ho sentito che questa domanda di probabilità elementare classica mancava ancora di una risposta completa dopo diversi mesi, quindi ne darò una qui.

Dalla dichiarazione del problema, vogliamo la distribuzione di

Y=max{X1,...,Xn}

dove sono iid . Sappiamo che se e solo se ogni elemento del campione è inferiore a . Quindi questo, come indicato nel suggerimento di @ varty, combinato con il fatto che gli sono indipendenti, ci consente di dedurreX1,...,XnUniform(a,b)Y<xxXi

P(Yx)=P(X1x,...,Xnx)=i=1nP(Xix)=FX(x)n

dove è il CDF della distribuzione uniforme . Pertanto il CDF di è FX(x)Y

FY(y)=P(Yy)={0ya[(ya)/(ba)]ny(a,b)1yb

Poiché ha una distribuzione assolutamente continua , possiamo derivarne la densità differenziando il CDF . Quindi la densità di èYY

pY(y)=n(ya)n1(ba)n

Nel caso speciale in cui , abbiamo che , che è la densità di una distribuzione Beta con e , poiché .a=0,b=1pY(y)=nyn1α=nβ=1Beta(n,1)=Γ(n+1)Γ(n)Γ(1)=n!(n1)!=n

Come nota, la sequenza che si ottiene se si dovesse ordinare il campione in ordine crescente - - sono chiamate statistiche dell'ordine . Una generalizzazione di questa risposta è che tutte le statistiche dell'ordine di un campione distribuito hanno una distribuzione Beta , come indicato nella risposta di @ bnaul. X(1),...,X(n)Uniform(0,1)


Questa in realtà era una domanda per me. Grazie per la spiegazione.
Paul PM,

Sento che dovrei essere in grado di prendere le tue opinioni qui e rispondere a questa domanda , ma non vedo come farlo. Puoi aiutarmi? puoi consigliare un libro di testo o un capitolo che parla di questo problema generale?

@PaulPM Per interesse, quale corso copre questo tipo di problema? Non è qualcosa che ho incontrato nel mio corso di probabilità di ingegneria.
Alex,

6

Il massimo di un campione è una delle statistiche dell'ordine , in particolare la statistica del ° ordine del campione . In generale, calcolare la distribuzione delle statistiche sugli ordini è difficile, come descritto dall'articolo di Wikipedia; per alcune distribuzioni speciali, le statistiche sugli ordini sono ben note (ad esempio per la distribuzione uniforme, che ha statistiche sugli ordini distribuiti in beta).nX1,,Xn

EDIT: l'articolo di Wikipedia sul massimo e minimo di esempio è anche utile e più specifico per il tuo problema.


5
Per le distribuzioni con densità, calcolare la distribuzione marginale di una statistica di un ordine particolare è abbastanza semplice. È ancora più facile per statistiche di ordini "speciali" come il minimo e il massimo.
cardinale il

Immagino che dipenda da cosa si intende per "calcolare" nella domanda originale. Certamente farlo numericamente è semplice; Ho interpretato la domanda come chiedere come trovare una soluzione a forma chiusa, che in generale non è facile.
bnaul

8
@bnaul: Sia essere arbitraria funzione di distribuzione e lasciare essere un campione iid da . Consenti a essere la statistica del ° ordine. QuindiQED . F(x)=P(Xx)X1,,XnFX(k)k
P(X(k)x)=m=knP(|{i:Xix}|=m)=m=kn(nm)F(x)m(1F(x))nm.
cardinale il

1
Forse un modo per capire la risposta dei cardinali (dato che si capisce la statistica degli ordini per l'uniforme) è che, poiché i cdf sono trasformazioni monotoniche da 1 a 1 di un cdf uniforme, possiamo sempre esprimere l'evento {X <a} in termini di uniforme variabile casuale (ecco perché funziona monte carlo). Quindi qualsiasi risultato basato su una distribuzione uniforme si generalizzerà facilmente ad altre variabili casuali - basta applicare la trasformazione . U=FX(X)
probabilityislogic

2
@probabilityislogic: l'intuizione è buona, anche se sembra che tu abbia in mente variabili casuali continue nel tuo commento. (Il risultato nel mio secondo commento sopra, ad esempio, funziona per una funzione di distribuzione arbitraria.)
Cardinale

1

Se è il CDF di , allora È quindi possibile utilizzare la proprietà iid e il cdf di una variabile uniforme per calcolare .FY(y)Y

FY(y)=Prob(y>X1,y>X2,...,y>Xn)
FY(y)

-3

Il massimo di un set di variabili casuali IID quando opportunamente normalizzato converge generalmente in uno dei tre tipi di valori estremi. Questo è il teorema di Gnedenko, l'equivalenza del teorema limite centrale per gli estremi. Il tipo particolare dipende dal comportamento della coda della distribuzione della popolazione. Sapendo questo puoi usare la distribuzione limitante per approssimare la distribuzione al massimo.

Poiché la distribuzione uniforme su [a, b] è l'oggetto di questa domanda, Macro ha dato la distribuzione esatta per ogni n e una risposta molto bella. Il risultato è piuttosto banale. Per la distribuzione normale non è possibile una buona forma chiusa, ma opportunamente normalizzato il massimo per la normale converge alla distribuzione Gumbel F (x) = exp (- e ).x

Per l'uniforme la normalizzazione è (ba) -x / n e F (bax / n) = (1-x / [n (ba)])nn

che converge in e . Nota qui che y = bax / n. e F (y) converge in 1 mentre y va in ba. Questo vale per tutti 0 x/(ba)n

In questo caso è facile confrontare il valore esatto con il suo limite asintotico.

Il libro di Gumbel

Il libro di Galambos

Il libro di Leadbetter

Libro di Novak

Libro Coles


4
Affinché questa risposta sia praticabile, è necessario stabilire in dettaglio come "normalizzare appropriatamente" i valori e inoltre è necessario fornire un modo per stimare quanto grande deve essere prima che la formula asintotica diventi un'approssimazione affidabile. n
whuber

@whuber Chiunque può vedere il teorema di Gnedenko per vedere la normalizzazione. Altrettanto importanti sono le caratteristiche della coda che determinano quale dei tre tipi si applica. Il teorema generalizza i processi stocastici stazionari. Quindi chiunque voglia conoscere i dettagli grintosi può guardare il libro di Leadbetter o la mia tesi di dottorato. Quando n è abbastanza grande, è una domanda difficile a cui rispondere per qualsiasi forma di asintotici. Immagino che il teorema di Berry-Esseen aiuti per il teorema del limite centrale. Non so cosa sia paragonabile agli estremi.
Michael Chernick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.