Differenza tra distribuzione normale standard multivariata e copula gaussiana


17

Mi chiedo quale sia la differenza tra la distribuzione normale standard multivariata e la copula gaussiana da quando guardo la funzione di densità mi sembrano le stesse.

Il mio problema è perché viene introdotta la copula gaussiana o quale beneficio genera la copula gaussiana o quale sia la sua superiorità quando la copula gaussiana non è altro che una funzione normale standard multivariata stessa.

Inoltre qual è il concetto alla base della trasformazione integrale di probabilità in copula? Voglio dire, sappiamo che una copula è una funzione con variabile uniforme. Perché deve essere uniforme? Perché non usare i dati reali come la distribuzione normale multivariata e trovare la matrice di correlazione? (Normalmente tracciamo i ritorni delle due risorse per considerare le loro relazioni, ma quando si tratta di copula, tracciamo gli Stati Uniti che sono invece probabilità).

Un'altra domanda. Dubito anche che la matrice di correlazione di MVN possa essere non parametrica o semi-parametrica come quella della copula (per il parametro della copula può essere la tau di Kendall, ecc.)

Sarei molto grato per il tuo aiuto dato che sono nuovo in questo settore. (ma ho letto molti articoli e queste sono le uniche cose che non capisco)


Come stai "guardando la funzione di densità"? È possibile che non si stia utilizzando un metodo sufficientemente sensibile. Ad esempio, la densità non è sicuramente multivariata normale quando i marginali non sono normali! Prova questo utilizzando una copula gaussiana con un multimodale di distribuzione, come ad esempio una Beta : che dovrebbe guardare decisamente non normale! (1/2,1/2)
whuber

l'equazione (6) è copula gaussiana bivariata CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/… mentre la prima equazione della sezione descrittiva è CDF normale standard bivariata roguewave.com/portals/0/products/ imsl-numerical-libraries / ... e quando li confrontiamo insieme, la forma funzionale è molto simile. bene sono esattamente gli stessi per me.
user26979,

Hai ragione: è per questo che non dovresti fare affidamento su riferimenti casuali a Internet, specialmente quelli con termini mal definiti e una composizione terribile. Consulta Nelson (una delle fonti per il tuo primo link, ed eminentemente leggibile).
whuber

1
quindi, se non menzionare il sito sopra, qual è la differenza secondo te?
user26979,

Risposte:


20

Una regola generale sui documenti tecnici - specialmente quelli trovati sul Web - è che l'affidabilità di qualsiasi definizione statistica o matematica offerta in essi varia inversamente al numero di argomenti non statistici non correlati citati nel titolo del documento. Il titolo della pagina nel primo riferimento offerto (in un commento alla domanda) è "Dalla finanza alla cosmologia: la copula della struttura su larga scala". Con sia la "finanza" che la "cosmologia" in primo piano, possiamo essere abbastanza sicuri che questa non sia una buona fonte di informazioni sulle copule!

Passiamo invece a un libro di testo standard e molto accessibile, Un'introduzione alle copule di Roger Nelsen (Seconda Edizione, 2006), per le definizioni chiave.

... ogni copula è una funzione di distribuzione congiunta con margini uniformi sull'intervallo di unità chiuso .[0,1]]

[A pag. 23, in basso.]

Per alcune informazioni sulle copule, passa al primo teorema del libro, Teorema di Sklar :

Lasciare sia una funzione di distribuzione congiunta con margini F e G . Quindi esiste una copula C tale che per tutti x , y in [i numeri reali estesi], H ( x , y ) = C ( F ( x ) , G ( y ) ) .HFsolCX,y

H(X,y)=C(F(X),sol(y)).

[Dichiarato alle pagine 18 e 21.]

Sebbene Nelsen non la definisca tale, in un esempio definisce la copula gaussiana :

... se indica la funzione di distribuzione normale standard (univariata) e N ρ indica la funzione di distribuzione normale bivariata standard (con il coefficiente di correlazione momento-prodotto di Pearson ρ ), quindi ... C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

[a p. 23, equazione 2.3.6]. Dalla notazione è immediato che questa è effettivamente la distribuzione congiunta per ( u , v ) quando ( Φ - 1 ( u ) , Φ - 1 (C(u,v) è bivariata normale. Ora possiamo girarci attorno ecostruire una nuova distribuzione bivariatacon qualsiasi distribuzione marginale (continua) desiderata F e G per cui questa C è la copula, semplicemente sostituendo queste occorrenze di Φ con F e(Φ1(u),Φ1(v))FGCΦF : prendiquestoparticolare C nella caratterizzazione delle copule sopra.GC

Quindi sì, questo assomiglia notevolmente alle formule per una distribuzione normale bivariata, perché è normale bivariata per le variabili trasformate . Poiché queste trasformazioni saranno non lineari ogni volta che F e G non sono già CDF normali (univariati), la distribuzione risultante non è (in questi casi) normale bivariata.(Φ1(F(x)),Φ1(G(y)))Fsol


Esempio

F(4,2)Xsol(2)YHFsolXy

Tracciare

0X10y

La mancanza di simmetria la rende ovviamente non normale (e senza margini normali), ma ha comunque una copula gaussiana per costruzione. FWIW ha una formula ed è brutto, anche ovviamente non bivariato Normale:

132(20(1-X)X3)(e-yy)exp(w(X,y))

w(X,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx


Grazie per la modifica, @Cardinal: sono imbarazzato per l'ortografia errata del nome di Nelsen, specialmente quando lo guardavo proprio sul davanti del libro! (A mia difesa, l'avevo notato per la prima volta nella bibliografia del documento di riferimento del PO, dove è anche scritto in modo errato: deve essere rimasto bloccato con me. :-)
whuber

È stata una cosa così piccola, ho pensato di andare avanti e fare le modifiche. L'ortografia è insolita (almeno in inglese!), Soprattutto rispetto alla variante più comune. :-)
Cardinale il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.