Teoria dei valori estremi - Mostra: da normale a Gumbel


21

Il massimo di iid Standardnormals converge alla distribuzione standard di Gumbel secondo Extreme Value Theory .X1,,Xn.

Come possiamo dimostrarlo?

abbiamo

P(maxXix)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

Dobbiamo trovare / scegliere an>0,bnR sequenze di costanti tali che:

F(anx+bn)nnG(x)=eexp(x)

Riesci a risolverlo o trovarlo in letteratura?

Ci sono alcuni esempi a pag.6 / 71 , ma non per il caso normale:

Φ(anx+bn)n=(12πanx+bney22dy)neexp(x)

Risposte:


23

Un modo indiretto è il seguente:
Per distribuzioni assolutamente continue, Richard von Mises (in un articolo del 1936 "La distribuzione del più grande valore" , che sembra essere stato riprodotto in inglese? In un'edizione del 1964 con selezionato suoi documenti), ha fornito le seguenti condizioni sufficienti affinché il massimo di un campione converga allo standard Gumbel, G(x) :

Sia la funzione di distribuzione comune di iid variabili casuali e loro densità comune. Quindi, senF(x)nf(x)

limxF1(1)(ddx(1F(x))f(x))=0X(n)dG(x)

Usando la solita notazione per lo standard normale e calcolando la derivata, abbiamo

ddx(1Φ(x))ϕ(x)=ϕ(x)2ϕ(x)(1Φ(x))ϕ(x)2=ϕ(x)ϕ(x)(1Φ(x))ϕ(x)1

Nota che . Inoltre, per la distribuzione normale, . Quindi dobbiamo valutare il limiteF-1(1)=ϕ(x)ϕ(x)=xF1(1)=

limx(x(1Φ(x))ϕ(x)1)

Ma è il rapporto di Mill, e sappiamo che il rapporto di Mill per la normale standard tende a mentre cresce. Così 1/x(1Φ(x))ϕ(x)1/xx

limx(x(1Φ(x))ϕ(x)1)=x1x1=0

e la condizione sufficiente è soddisfatta.

Le serie associate sono indicate come

an=1nϕ(bn),bn=Φ1(11/n)

ADDENDUM

Questo è dal cap. 10.5 del libro HA David & HN Nagaraja (2003), "Order Statistics" (edizione 3d) .

f ( t ) f ( t ) w ( t )ξa=F1(a) . Inoltre, il riferimento a de Haan è "Haan, LD (1976). Esempi estremi: un'introduzione elementare. Statistica Neerlandica, 30 (4), 161-172. " Ma attenzione perché parte della notazione ha contenuti diversi in de Haan - per esempio nel libro è la funzione di densità di probabilità, mentre in de Haan indica la funzione del libro (cioè il rapporto di Mill). Inoltre, De Haan esamina le condizioni sufficienti già differenziate.f(t) f(t)w(t)

inserisci qui la descrizione dell'immagine


Non sono sicuro di aver capito la tua soluzione. Quindi hai preso come normale CDF standard. Ho seguito e concordo sul fatto che la condizione sufficiente è soddisfatta. Ma in che modo le serie associate e sono fornite all'improvviso da quelle? a n b nFanbn
renrenthehamster,

@renrenthehamster Penso che queste due parti siano dichiarate indipendentemente (nessuna connessione diretta).
emcor

E quindi come si possono ottenere le serie associate? Comunque, ho aperto una domanda su questo problema (e più in generale, per altre distribuzioni oltre la normale norma)
renrenthehamster

@renrenthehamster Ho aggiunto materiale pertinente. Non credo che ci sia una ricetta standard per tutti i casi, per trovare queste serie.
Alecos Papadopoulos,

14

La domanda pone due cose: (1) come mostrare che il massimo converge, nel senso che converge (in distribuzione) per le sequenze opportunamente scelte e , alla distribuzione Gumbel standard e (2) come trovare tali sequenze. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n)(X(n)bn)/an(an)(bn)

Il primo è noto e documentato negli articoli originali sul teorema di Fisher-Tippett-Gnedenko (FTG). Il secondo sembra essere più difficile; questo è il problema affrontato qui.

Si noti che per chiarire alcune affermazioni che appaiono altrove in questo thread, quello

  1. Il massimo non converge in nulla: diverge (anche se molto lentamente).

  2. Sembrano esserci diverse convenzioni riguardanti la distribuzione di Gumbel. Adotterò la convenzione secondo cui il CDF di una distribuzione Gumbel invertita è, in scala e in posizione, dato da . Un massimo opportunamente standardizzato di variate normali iid converge in una distribuzione Gumbel invertita.1exp(exp(x))


Intuizione

Quando è identificato con la comune funzione di distribuzione , la distribuzione del massimo è F X (XiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

Quando il supporto di non ha limite superiore, come con una distribuzione normale, la sequenza di funzioni marcia per sempre verso destra senza limiti:F nFFn

Figura 1

Sono mostrati grafici parziali di per . n = 1 , 2 ,Fnn=1,2,22,24,28,216

Per studiare le forme di queste distribuzioni, possiamo spostare ciascuna a sinistra di una certa quantità e ridimensionarla di per renderle comparabili.a nbnan

figura 2

Ognuno dei grafici precedenti è stato spostato per posizionare la sua mediana su e rendere il suo intervallo interquartile di unità di lunghezza.0

FTG afferma che le sequenze e possono essere scelte in modo che queste funzioni di distribuzione convergano in senso puntuale ad ogni in una distribuzione di valore estremo , fino alla scala e alla posizione. Quando è una distribuzione normale, la particolare distribuzione di valore estremo limitante è un Gumbel invertito, fino alla posizione e alla scala.((an)x F(bn)xF


Soluzione

Si è tentati di emulare il teorema del limite centrale standardizzando per avere media unità e varianza unità. Ciò è inappropriato, tuttavia, in parte perché FTG si applica anche alle distribuzioni (continue) che non hanno primi o secondi momenti. Invece, utilizzare un percentile (come la mediana) per determinare la posizione e una differenza di percentili (come l'IQR) per determinare la diffusione. (Questo approccio generale dovrebbe riuscire a trovare e per qualsiasi distribuzione continua.)a n b nFnanbn

Per la distribuzione normale standard, questo risulta essere facile! Lascia . Un quantile di corrispondente a è qualsiasi valore per il quale . Richiamando la definizione di , la soluzione èF n q x q F n ( x q ) = q0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)

xq;n=F1(q1/n).

Pertanto possiamo impostare

bn=x1/2;n, an=x3/4;nx1/4;n; Gn(x)=Fn(anx+bn).

Poiché, per costruzione, la mediana di è e il suo IQR è , la mediana del valore limite di (che è una versione di un Gumbel invertito) deve essere e il suo IQR deve essere . Lascia che il parametro scale sia e che il parametro location sia . Poiché la mediana è e il QIQ è facilmente reperibile come , i parametri devono essereGn01Gn01βαα+βloglog(2)β(loglog(4)loglog(4/3))

α=loglog2loglog(4/3)loglog(4); β=1loglog(4)loglog(4/3).

Non è necessario che e siano esattamente questi valori: devono solo approssimarli, a condizione che il limite di sia ancora questa distribuzione Gumbel invertita. Un'analisi semplice (ma noiosa) per una normale standard indica che le approssimazionianbnGnF

an=log((4log2(2))/(log2(43)))22log(n), bn=2log(n)log(log(n))+log(4πlog2(2))22log(n)

funzionerà benissimo (e sarà il più semplice possibile).

Figura 3

Le curve azzurre sono grafici parziali di per usando le sequenze approssimative e . La linea rosso scuro rappresenta graficamente la distribuzione Gumbel invertita con i parametri e . La convergenza è chiara (sebbene il tasso di convergenza per la negativa sia notevolmente più lento). n = 2 , 2 6 , 2 11 , 2 16 a n b n α β xGnn=2,26,211,216anbnαβx


Riferimenti

BV Gnedenko, sulla distribuzione limitante del termine massimo in una serie casuale . In Kotz e Johnson, scoperte nella statistica Volume I: Fondamenti e teoria di base, Springer, 1992. Tradotto da Norman Johnson.


@Vossler La formula nel post di per converge a come . Si comporta come per grande . 0 n ( 2 log ( n ) - log ( 2 π ) ) - 1 / 2 nan0n(2log(n)log(2π))1/2n
whuber

Sì, è vero, me ne sono reso conto poco dopo aver pubblicato il mio commento, quindi l'ho eliminato immediatamente. Grazie!
Vossler

@Jess Avevo sperato che questa risposta potesse essere intesa come dimostrazione, tra l'altro, che non esiste una formula "la": ci sono innumerevoli formule corrette per eb n .anbn.
whuber

@Jess Va meglio, perché dimostrare un approccio alternativo è stata la motivazione per scrivere questa risposta. Non capisco la tua insinuazione che ho ritenuto "inutile scrivere una risposta", perché è esplicitamente quello che ho fatto qui.
whuber

@Jess Non posso continuare questa conversazione perché è interamente unilaterale: devo ancora riconoscere tutto ciò che ho scritto in una qualsiasi delle tue caratterizzazioni. Sto smettendo mentre sono dietro.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.