Esempio di distribuzione dalla coda pesante che non è a coda lunga


14

Dalle letture sulle distribuzioni a coda lunga e lunga, ho capito che tutte le distribuzioni a coda lunga sono a coda pesante , ma non tutte le distribuzioni a coda lunga sono a coda lunga .

Qualcuno potrebbe fornire un esempio di:

  • una funzione di densità continua, simmetrica, a media zero che è a coda lunga
  • una funzione di densità continua, simmetrica, a media zero, dalla coda pesante ma non dalla coda lunga

così posso capire meglio il significato delle loro definizioni?

Sarebbe ancora meglio se entrambi potessero avere una varianza unitaria.


2
Dove hai trovato quelle definizioni? Puoi darli qui? Ho pensato a questi come sinonimi!
kjetil b halvorsen,


@kjetilbhalvorsen SA: Vedi, link E. LA: stavo studiando le definizioni delle distribuzioni "pesante", "grasso" e "long tailed", e ho trovato utili spiegazioni su: (A) [ stats.stackexchange.com/ questions / 10726 /… , (B) [ en.wikipedia.org/wiki/Heavy-tailed_distribution] , (C) [ users.cms.caltech.edu/~adamw/papers/… , (continua)
toliveira

(continuazione) (E) math.stackexchange.com/questions/685921/… Ho capito che (i) la distribuzione dalla coda pesante è definita come in A, B, C, D, E, (ii) la distribuzione dalla coda lunga è definita come in B, C, E (iii) la definizione di coda grassa è sciolta, come spiegato in A.
toliveira,

Risposte:


16

Le due definizioni sono vicine, ma non esattamente le stesse. Una differenza sta nella necessità che il rapporto di sopravvivenza abbia un limite.

Per la maggior parte di questa risposta ignorerò i criteri per la distribuzione come continua, simmetrica e di varianza finita, poiché sono facili da realizzare una volta trovata una distribuzione dalla coda pesante con varianza finita che non è a coda lunga.


Una distribuzione è pesante dalla coda quando per qualsiasi t > 0 ,Ft>0

(1)RetXdF(X)=.

Una distribuzione con funzione di sopravvivenza è lunga coda quandosolF=1-F

(2)limxGF(x+1)GF(x)=1.

Le distribuzioni dalla coda lunga sono pesanti. Inoltre, poiché aumenta, il limite del rapporto ( 2 ) non può superare 1 . Se esiste ed è inferiore a 1 , allora G sta diminuendo esponenzialmente - e ciò consentirà alla integrale ( 1 ) di convergere.G(2)11G(1)

L'unico modo per esibire una distribuzione a coda pesante che non è a coda lunga, quindi, è modificare una distribuzione a coda lunga in modo che continui a trattenere mentre ( 2 ) viene violato. È facile rovinare un limite: cambiarlo in infiniti luoghi che divergono all'infinito. Civorrà un po 'a che fare con F , che deve rimanere crescente e cadlag. Un modo è introdurre alcuni salti verso l'alto in F , che faràsaltare G verso il basso, abbassando il rapporto G F ( x + 1 ) / G F ( x )(1)(2)FFsolGF(x+1)/GF(x). A tal fine, definiamo una trasformazione che trasforma F in un'altra funzione di distribuzione valida durante la creazione di un salto improvviso al valore u , dire un salto a metà strada tra F ( u ) a 1 :TuFuF(u)1

Tu[F](x)={F(x)u<x12(1F(x))+F(x)ux

Ciò non altera alcuna proprietà di base di : T u [ F ] è ancora una funzione di distribuzione.FTu[F]

L'effetto su è farlo cadere per un fattore di 1 / 2 a u . Pertanto, poiché G non è in diminuzione, ogni volta che u - 1 x < u ,GF1/2uGu1x<u

GTu[F](x+1)GTu[F](x)12.

Se scegliamo una sequenza crescente e divergente di , i = 1 ,ui , e applicare ogni T u i in successione, determina una sequenza di distribuzioni F i con F 0 = F ei=1,2,TuiFiF0=F

Fi+1=Tui[Fi]

per . Dopo l' i esimo gradino, F i ( x ) , F i +i1ithtutto rimane la stessa perx< u i . Di conseguenza la sequenza di F i (x)è una sequenza non decrescente, limitata, puntuale di funzioni di distribuzione, che implica il suo limiteFi(x),Fi+1(x),x<uiFi(x)

F=limiFi

è una funzione di distribuzione. Per costruzione, non è a coda lunga perché ci sono infiniti punti in cui il suo rapporto di sopravvivenza scende a 1 / 2 o inferiore, mostrando non può avere 1 come un limite.GF(x+1)/GF(x))1/21

Figure 1: An altered survival function

Questo grafico mostra una funzione di sopravvivenza G(x)=x1/5 che è stato tagliato in questo modo ai punti Notare l'asse verticale logaritmico.u112.9,u240.5,u3101.6,.

La speranza è quella di essere in grado di scegliere in modo tale che F rimane pesante dalla coda. Sappiamo, poiché F ha la coda pesante, che ci sono numeri(ui)FF per i quali0=u0<u1<u2<<un

ui1uiex/idF(x)2i1

per ogni . La ragione per la 2 i - 1 sulla destra è che le probabilità assegnate da F a valori fino a u i sono stati successivamente tagliato a metà i - 1 volte. Tale procedura, quando d F ( x ) è sostituita da d F j ( x ) per qualsiasi j i , ridurrà 2 i - 1 a 1 , ma non inferiore.i12i1Fuii1dF(x)dFj(x)ji2i11

Figure 2: A cut-down density function

Questo è un diagramma di per densità f corrispondente alla precedente funzione di sopravvivenza e alla sua versione "ridotta". Le aree al di sotto di questa curva contribuiscono alle aspettative. L'area da 1 a u 1 è 1 ; l'area da u 1 a u 2 è 2 , che quando viene ridotta (nella parte blu inferiore) diventa un'area di 1 ; l'area da u 2 a u 3 è 4 , che quando viene ridotta diventa un'area di 1xf(x)f1u11u1u221u2u341, e così via. Pertanto, l'area sotto ogni "gradino" successivo a destra è .1

Scegliamo una tale sequenza per definire F . Possiamo verificare che rimanga pesante scegliendo t = 1 / n per un numero intero n e applicando la costruzione:(ui)Ft=1/nn

RetxdF(x)=Rex/ndF(x)=i=1ui1uiex/ndF(x)i=n+1ui1uiex/ndF(x)i=n+1ui1uiex/idF(x)=i=n+1ui1uiex/idFi(x)i=n+11,

which still diverges. Since t is arbitrarily small, this demonstrates that F remains heavy-tailed, even though its long-tailed property has been destroyed.

Figure 3: plot of G(1+x)/G(x)

This is a plot of the survival ratio G(x+1)/G(x) for the cut down distribution. Like the ratio of the original G, it tends toward an upper accumulation value of 1--but for unit-width intervals terminating at the ui, the ratio suddenly drops to only half of what it originally was. These drops, although becoming less and less frequent as x increases, occur infinitely often and therefore prevent the ratio from approaching 1 in the limit.


If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution. F(x)=1xp (for x>0) will do, provided p>1; so would a Student t distribution for any degrees of freedom exceeding 2. The moments of F cannot exceed those of F, whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).

Symmetrize the result--which I will still call F--by defining

Fs(x)=12(1+sgn(x)F(|x|))

for all xR. Its variance will remain finite, so it can be standardized to the desired distribution.


2
Brilliantly explained. You offered not just an example but also the justification for it. The clarity of the explanation allowed me to understand (almost) the whole of it. I will practice it in some numerical examples.
toliveira
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.