La prima cosa da fare è formalizzare ciò che intendiamo per "coda più pesante". Si potrebbe teoricamente vedere quanto è alta la densità nella coda estrema dopo aver standardizzato entrambe le distribuzioni per avere la stessa posizione e scala (ad esempio deviazione standard):
(da questa risposta, che è anche in qualche modo rilevante per la tua domanda )
[In questo caso, il ridimensionamento non ha davvero importanza alla fine; la t sarà comunque "più pesante" della normale anche se si usano scale molto diverse; il normale alla fine si abbassa sempre]
Tuttavia, quella definizione - sebbene funzioni bene per questo particolare confronto - non si generalizza molto bene.
Più in generale, una definizione molto migliore è nella risposta di Whuber qui . Quindi se una coda più pesante di , poiché diventa sufficientemente grande (per tutte qualche ), allora , dove , dove è il cdf (per più pesante -coda a destra; c'è una definizione simile, ovvia dall'altra parte).YXtt>t0SY(t)>SX(t)S=1−FF
Eccolo sulla scala logaritmica e sulla scala quantile della normale, che ci consente di vedere più dettagli:
Quindi la "prova" di una coda più pesante comporterebbe il confronto dei cdf e la dimostrazione che la coda superiore del t-cdf alla fine si trova sempre al di sopra di quella normale e la coda inferiore del t-cdf alla fine si trova sempre al di sotto di quella normale.
In questo caso la cosa facile da fare è confrontare le densità e quindi mostrare che la posizione relativa corrispondente dei cdf (/ funzioni di sopravvissuto) deve seguire da quella.
Ad esempio, se puoi argomentare che (in alcuni dati )ν
x2−(ν+1)log(1+x2ν)>2⋅log(k)†
per la costante necessaria (una funzione di ν ), per tutti x > alcuni x 0 , sarebbe possibile stabilire una coda più pesante per t ν anche sulla definizione in termini di maggiore 1 - F (o maggiore F sulla coda sinistra).kνx>x0tν1−FF
(questa forma deriva dalla differenza del registro delle densità, se contiene la relazione necessaria tra le densità)†
[In realtà è possibile mostrarlo per qualsiasi (non solo quello particolare di cui abbiamo bisogno dalle costanti che normalizzano la densità), quindi il risultato deve valere per il k di cui abbiamo bisogno.]kk