distribuzione t con coda più pesante della distribuzione normale


10

Nei miei appunti di lezione dice:

la distribuzione a T sembra normale, sebbene con code leggermente più pesanti.

Capisco perché sembrerebbe normale (a causa del Teorema del limite centrale). Ma ho difficoltà a capire come dimostrare matematicamente che ha code più pesanti della distribuzione normale e se c'è un modo per misurare in che misura è più pesante della distribuzione normale.

Risposte:


12

La prima cosa da fare è formalizzare ciò che intendiamo per "coda più pesante". Si potrebbe teoricamente vedere quanto è alta la densità nella coda estrema dopo aver standardizzato entrambe le distribuzioni per avere la stessa posizione e scala (ad esempio deviazione standard):

inserisci qui la descrizione dell'immagine
(da questa risposta, che è anche in qualche modo rilevante per la tua domanda )

[In questo caso, il ridimensionamento non ha davvero importanza alla fine; la t sarà comunque "più pesante" della normale anche se si usano scale molto diverse; il normale alla fine si abbassa sempre]

Tuttavia, quella definizione - sebbene funzioni bene per questo particolare confronto - non si generalizza molto bene.

Più in generale, una definizione molto migliore è nella risposta di Whuber qui . Quindi se una coda più pesante di , poiché diventa sufficientemente grande (per tutte qualche ), allora , dove , dove è il cdf (per più pesante -coda a destra; c'è una definizione simile, ovvia dall'altra parte).YXtt>t0SY(t)>SX(t)S=1FF

inserisci qui la descrizione dell'immagine

Eccolo sulla scala logaritmica e sulla scala quantile della normale, che ci consente di vedere più dettagli:

inserisci qui la descrizione dell'immagine

Quindi la "prova" di una coda più pesante comporterebbe il confronto dei cdf e la dimostrazione che la coda superiore del t-cdf alla fine si trova sempre al di sopra di quella normale e la coda inferiore del t-cdf alla fine si trova sempre al di sotto di quella normale.

In questo caso la cosa facile da fare è confrontare le densità e quindi mostrare che la posizione relativa corrispondente dei cdf (/ funzioni di sopravvissuto) deve seguire da quella.

Ad esempio, se puoi argomentare che (in alcuni dati )ν

x2(ν+1)log(1+x2ν)>2log(k)

per la costante necessaria (una funzione di ν ), per tutti x > alcuni x 0 , sarebbe possibile stabilire una coda più pesante per t ν anche sulla definizione in termini di maggiore 1 - F (o maggiore F sulla coda sinistra).kνx>x0tν1FF

(questa forma deriva dalla differenza del registro delle densità, se contiene la relazione necessaria tra le densità)

[In realtà è possibile mostrarlo per qualsiasi (non solo quello particolare di cui abbiamo bisogno dalle costanti che normalizzano la densità), quindi il risultato deve valere per il k di cui abbiamo bisogno.]kk


1
logS(x)x

1
@Henry ho generato una trama del genere ma non ero sicuro di quanto valore avesse aggiunto, quindi non l'ho incluso. Ci penserò io a metterlo dentro.
Glen_b -Restinata Monica,

1
@ Henry ho incluso la trama.
Glen_b -Restate Monica,

2

E{xn}.

Code "più pesanti" significheranno valori più alti per i momenti di potenza pari (potenza 4, 6, 8), quando la varianza è la stessa. In particolare, il momento del 4 ° ordine (intorno allo zero) è chiamato kurtosi e confronta in un certo senso la pesantezza delle code.

Vedi Wikipedia per i dettagli ( https://en.wikipedia.org/wiki/Kurtosis )


1
t34214

3
t(ν)+xνννtν

2

Ecco una prova formale basata sulle funzioni di sopravvivenza. Uso la seguente definizione di "coda più pesante" ispirata a Wikipedia :

YSy(t)XSx(t)

limtSy(t)Sx(t)=

Considera una variabile casuale distribuita come t di Student con zero medio, gradi di libertà e parametro di scala . Confrontiamo questo con la variabile casuale . Per entrambe le variabili, le funzioni di sopravvivenza sono differenziabili. Perciò, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
Dove abbiamo sostituito . Nota che è una costante, e Quindi dal teorema del limite algebrico, u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

È importante sottolineare che il risultato vale per valori arbitrari (finiti) di , e , quindi è possibile che si verifichino situazioni in cui la distribuzione presenta una varianza minore rispetto a una normale, ma con code più pesanti.aσ2ν


1
Solo una nota che questa "definizione" di code più pesanti non è sempre accettabile. Ad esempio, la distribuzione N (0,1), con questa definizione, ha code più pesanti rispetto alla distribuzione .9999 * U (-1,1) + .0001 * U (-1000, 1000), anche se quest'ultima distribuzione produce valori occasionali fino a 175 deviazioni standard dalla media, nonostante abbia limitato il supporto. Naturalmente, anche N (0,1) produce tali valori, ma con probabilità ben al di sotto di ciò che può essere considerato rilevante ai fini pratici.
Peter Westfall,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.