La domanda pone due cose: (1) come mostrare che il massimo converge, nel senso che converge (in distribuzione) per le sequenze opportunamente scelte e , alla distribuzione Gumbel standard e (2) come trovare tali sequenze. ( X ( n ) - b n ) / a n ( a n ) ( b n )X( n )( X( n )- bn) / an( an)( bn)
Il primo è noto e documentato negli articoli originali sul teorema di Fisher-Tippett-Gnedenko (FTG). Il secondo sembra essere più difficile; questo è il problema affrontato qui.
Si noti che per chiarire alcune affermazioni che appaiono altrove in questo thread, quello
Il massimo non converge in nulla: diverge (anche se molto lentamente).
Sembrano esserci diverse convenzioni riguardanti la distribuzione di Gumbel. Adotterò la convenzione secondo cui il CDF di una distribuzione Gumbel invertita è, in scala e in posizione, dato da . Un massimo opportunamente standardizzato di variate normali iid converge in una distribuzione Gumbel invertita.1 -exp( - exp( x ) )
Intuizione
Quando è identificato con la comune funzione di distribuzione , la distribuzione del massimo è F X (XioFX( n )
Fn( x ) = Pr ( X( n )≤ x ) = Pr ( X1≤ x ) Pr ( X2≤ x ) ⋯ Pr ( Xn≤ x ) = Fn( x ) .
Quando il supporto di non ha limite superiore, come con una distribuzione normale, la sequenza di funzioni marcia per sempre verso destra senza limiti:F nFFn
Sono mostrati grafici parziali di per . n = 1 , 2 ,Fnn = 1 , 2 , 22, 24, 28, 216
Per studiare le forme di queste distribuzioni, possiamo spostare ciascuna a sinistra di una certa quantità e ridimensionarla di per renderle comparabili.a nBnun'n
Ognuno dei grafici precedenti è stato spostato per posizionare la sua mediana su e rendere il suo intervallo interquartile di unità di lunghezza.0
FTG afferma che le sequenze e possono essere scelte in modo che queste funzioni di distribuzione convergano in senso puntuale ad ogni in una distribuzione di valore estremo , fino alla scala e alla posizione. Quando è una distribuzione normale, la particolare distribuzione di valore estremo limitante è un Gumbel invertito, fino alla posizione e alla scala.(( an)x F( bn)XF
Soluzione
Si è tentati di emulare il teorema del limite centrale standardizzando per avere media unità e varianza unità. Ciò è inappropriato, tuttavia, in parte perché FTG si applica anche alle distribuzioni (continue) che non hanno primi o secondi momenti. Invece, utilizzare un percentile (come la mediana) per determinare la posizione e una differenza di percentili (come l'IQR) per determinare la diffusione. (Questo approccio generale dovrebbe riuscire a trovare e per qualsiasi distribuzione continua.)a n b nFnun'nBn
Per la distribuzione normale standard, questo risulta essere facile! Lascia . Un quantile di corrispondente a è qualsiasi valore per il quale . Richiamando la definizione di , la soluzione èF n q x q F n ( x q ) = q0 < q< 1FnqXqFn( xq) = qFn( x ) = Fn( x )
Xq; n= F- 1( q1 / n) .
Pertanto possiamo impostare
Bn= x1 / 2 ; n, a n= x3 / 4 ; n- x1 / 4 ; n; sol n( x ) = Fn( anx + bn) .
Poiché, per costruzione, la mediana di è e il suo IQR è , la mediana del valore limite di (che è una versione di un Gumbel invertito) deve essere e il suo IQR deve essere . Lascia che il parametro scale sia e che il parametro location sia . Poiché la mediana è e il QIQ è facilmente reperibile come , i parametri devono esseresoln01soln01βαα+βloglog(2)β(loglog(4)−loglog(4/3))
α=loglog2loglog(4/3)−loglog(4); β=1loglog(4)−loglog(4/3).
Non è necessario che e siano esattamente questi valori: devono solo approssimarli, a condizione che il limite di sia ancora questa distribuzione Gumbel invertita. Un'analisi semplice (ma noiosa) per una normale standard indica che le approssimazionianbnGnF
a′n=log((4log2(2))/(log2(43)))22log(n)−−−−−−√, b′n=2log(n)−−−−−−√−log(log(n))+log(4πlog2(2))22log(n)−−−−−−√
funzionerà benissimo (e sarà il più semplice possibile).
Le curve azzurre sono grafici parziali di per usando le sequenze approssimative e . La linea rosso scuro rappresenta graficamente la distribuzione Gumbel invertita con i parametri e . La convergenza è chiara (sebbene il tasso di convergenza per la negativa sia notevolmente più lento). n = 2 , 2 6 , 2 11 , 2 16 a ′ n b ′ n α β xGnn=2,26,211,216a′nb′nαβx
Riferimenti
BV Gnedenko, sulla distribuzione limitante del termine massimo in una serie casuale . In Kotz e Johnson, scoperte nella statistica Volume I: Fondamenti e teoria di base, Springer, 1992. Tradotto da Norman Johnson.