È possibile avere una coppia di variabili casuali gaussiane per le quali la distribuzione congiunta non è gaussiana?


91

Qualcuno mi ha posto questa domanda in un colloquio di lavoro e ho risposto che la loro distribuzione congiunta è sempre gaussiana. Ho pensato di poter sempre scrivere un gaussiano bivariato con i loro mezzi, la varianza e le covarianze. Mi chiedo se ci può essere un caso in cui la probabilità congiunta di due gaussiani non è gaussiana?


4
Un altro esempio da Wikipedia . Naturalmente, se le variabili sono indipendenti e marginalmente gaussiane, allora sono congiuntamente gaussiane.

Risposte:


138

La distribuzione normale bivariata è l' eccezione , non la regola!

È importante riconoscere che "quasi tutte" le distribuzioni congiunte con marginali normali non sono la distribuzione normale bivariata. Cioè, il punto di vista comune secondo cui le distribuzioni congiunte con marginali normali che non sono la normale bivariata sono in qualche modo "patologiche", è un po 'fuorviante.

Certamente, la normale multivariata è estremamente importante a causa della sua stabilità nelle trasformazioni lineari, e quindi riceve gran parte dell'attenzione nelle applicazioni.

Esempi

È utile iniziare con alcuni esempi. La figura seguente contiene mappe di calore di sei distribuzioni bivariate, tutte con margini normali standard. Quelle di sinistra e di mezzo nella fila superiore sono normali bivariate, le restanti no (come dovrebbe essere evidente). Sono descritti più avanti.

Esempi di distribuzione bivariata con marginali normali standard.

Le ossa nude delle copule

Le proprietà della dipendenza vengono spesso analizzate in modo efficiente usando le copule . Una copula bivariata è solo un nome di fantasia per una distribuzione di probabilità sul quadrato dell'unità con margini uniformi .[0,1]2

Supponiamo che sia una copula bivariata. Poi, immediatamente da quanto sopra, sappiamo che , e , per esempio.C ( u , v ) 0 C ( u , 1 ) = u C ( 1 , v ) = vC(u,v)C(u,v)0C(u,1)=uC(1,v)=v

Possiamo costruire variabili casuali bivariate sul piano euclideo con marginali prespecificati mediante una semplice trasformazione di una copula bivariata. Lascia che a e vengano prescritte distribuzioni marginali per una coppia di variabili casuali . Quindi, se è una copula bivariata, è una funzione di distribuzione bivariata con i margini e . Per vedere quest'ultimo fatto, basta notare che Lo stesso argomento funziona per .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2F1F2(X,Y)C(u,v)

F(x,y)=C(F1(x),F2(y))
F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
F2

Per e continui , il teorema di Sklar afferma un contrario che implica unicità. Cioè, data una distribuzione bivariata con margini continui , , la copula corrispondente è unica (nello spazio di intervallo appropriato).F1F2F(x,y)F1F2

Il normale bivariato è eccezionale

Il teorema di Sklar ci dice (essenzialmente) che esiste una sola copula che produce la distribuzione normale bivariata. Questa è, giustamente, la copula gaussiana che ha densità su dove il numeratore è la distribuzione normale bivariata con correlazione valutata in e .[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

Ma ci sono molte altre copule e tutte daranno una distribuzione bivariata con marginali normali che non è la normale bivariata usando la trasformazione descritta nella sezione precedente.

Alcuni dettagli sugli esempi

Si noti che se è una copula arbitraria con densità , la densità bivariata corrispondente con marginali normali standard sotto la trasformazione è C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

Si noti che applicando la copula gaussiana nell'equazione precedente, recuperiamo la densità normale bivariata. Ma, per qualsiasi altra scelta di , non lo faremo.c(u,v)

Gli esempi nella figura sono stati costruiti come segue (attraversando ogni riga, una colonna alla volta):

  1. Bivariato normale con componenti indipendenti.
  2. Bivariato normale con .ρ=0.4
  3. L' esempio fornito in questa risposta di Dilip Sarwate . Può essere facilmente indotto dalla copula con densità .C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. Generato dalla copula di Frank con il parametro .θ=2
  5. Generato dalla copula di Clayton con il parametro .θ=1
  6. Generato da una modifica asimmetrica della copula di Clayton con il parametro .θ=3

7
+1 per l'osservazione che la densità normale bivariata è il caso eccezionale!
Dilip Sarwate,

Forse mi manca qualcosa, ma se iniziamo da , la distribuzione congiunta viene definita automaticamente, indipendentemente da qualsiasi costruzione di copula, e se applichiamo un non- Costruzione di copula gaussiana ai loro CDF, è vero che otterremo un CDF non gaussiano , ma questa funzione in generale non sarà il CDF della coppia di variabili casuali abbiamo iniziato, giusto ? X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
Casuale Acquista il

Esempio di come simulare come nel pannello in basso a destra: library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
passaggio

1
@RandomGuy, ti stai perdendo un'ipotesi non dichiarata che . Se supponi che siano indipendenti, allora sì, conosci già la distribuzione congiunta. Senza il presupposto di indipendenza, conoscere le distribuzioni marginali non fornisce informazioni sufficienti per specificare la distribuzione congiunta. X1,X2independentN(0,1)
MentatOfDune,

25

È vero che ogni elemento di un vettore normale multivariato è esso stesso distribuito normalmente e puoi dedurne i mezzi e le varianze. Tuttavia, non è vero che due variabili casuali guassiane siano normalmente distribuite congiuntamente. Ecco un esempio:

Modifica: in risposta al consenso sul fatto che una variabile casuale che è una massa puntiforme possa essere pensata come una variabile normalmente distribuita con , sto cambiando il mio esempio.σ2=0


Sia e dove è una variabile casuale . Cioè, ciascuno con probabilità .XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

Mostriamo innanzitutto che ha una distribuzione normale standard. YSecondo la legge della probabilità totale ,

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

Il prossimo,

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

dove è il normale CDF standard . Allo stesso modo,Φ

P(Yy|B=1)=P(Xy)=Φ(y)

Perciò,

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

quindi, il CDF di è , quindi .YΦ()YN(0,1)

Ora mostriamo che non sono distribuiti congiuntamente normalmente. X,YCome sottolinea @cardinal, una caratterizzazione della normale multivariata è che ogni combinazione lineare dei suoi elementi è normalmente distribuita. non hanno questa proprietà, da alloraX,Y

Y+X={2Xif B=10if B=0.

Pertanto è una miscela di una variabile casuale e una massa in punti a 0, pertanto non può essere normalmente distribuita.Y+X50/50N(0,4)


4
Non sono d'accordo con questa risposta. Una massa di punto degenerato pari a a è generalmente considerata una variabile casuale gaussiana degenerata con varianza zero. Inoltre, non sono congiuntamente continui sebbene siano marginalmente continui. Per un esempio di due variabili aleatorie congiuntamente continue che sono marginalmente gaussiane ma non congiuntamente gaussiane, si veda, ad esempio, la seconda metà di questa risposta . 1μ(X,X)
Dilip Sarwate,

4
@DilipSarwate, la domanda era di fornire un esempio (se ne esiste uno) di due variabili che sono normalmente distribuite ma la loro distribuzione congiunta non è normale multivariata. Questo è un esempio La maggior parte delle definizioni standard della distribuzione normale (ad es. Wikipedia en.wikipedia.org/wiki/Normal_distribution ) richiedono che la varianza sia strettamente positiva, quindi non includendo una massa in punti come parte della famiglia delle distribuzioni normali.
Macro

4
Una caratterizzazione standard del gaussiano multivariato è che è gaussiano multivariato se e solo se è gaussiano per tutti . Come suggerisce @Dilip, vale la pena considerare se questo è vero per il tuo esempio. XRnaTXaRn
cardinale il

6
Dal momento che apparentemente non ti piacciono gli appelli alla razionalità ;-), che ne dici di appelli all'autorità? (È uno scherzo, se non è evidente.) Mi sono appena imbattuto in questo per puro caso mentre stavo guardando qualcos'altro: Esempio 2.4 , pagina 22 di GAF Seber e AJ Lee, Linear Regression Analysis , 2nd. ed., Wiley. Cita: "Sia e metti ... Quindi ha una distribuzione normale multivariata." YN(μ,σ2)Y=(Y,Y)Y
cardinale il

5
La discussione riguarda le definizioni. Chiaramente, se la matrice di covarianza per definizione deve essere una Macro non singolare fornisce un esempio, ma questo non è un esempio secondo la definizione più liberale a cui fa riferimento anche @cardinal. Un buon motivo per preferire la definizione più liberale è che tutte le trasformazioni lineari di variabili normali sono normali. In particolare, nella regressione lineare con errori normali i residui hanno una distribuzione normale unita ma la matrice di covarianza è singolare.
NRH,

5

Il seguente post contiene uno schema di una prova, solo per dare le idee principali e iniziare.

Sia due variabili casuali gaussiane indipendenti e sia sia z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

Ogni , ma poiché sono entrambe combinazioni lineari delle stesse r.vs indipendenti, sono congiuntamente dipendenti.XiN(μi,σi2)

Definizione Si dice che una coppia di r.vs è bivariata normalmente distribuita se può essere scritta come una combinazione lineare di r.vs normale indipendente .x=(X1,X2)x=Azz=(Z1,Z2)

Lemma Se è un gaussiano bivariato, qualsiasi altra combinazione lineare di essi è di nuovo una normale variabile casuale.x=(X1,X2)

Prova . Trivial, saltato per non offendere nessuno.

Proprietà Se non sono correlati, allora sono indipendenti e viceversa.X1,X2

Distribuzione diX1|X2

Supponiamo che siano gli stessi rsv gaussiani di prima, ma supponiamo che abbiano varianza positiva e media zero per semplicità.X1,X2

Se è il sottospazio espanso da , lascia e .SX2X1S=ρσX1σX2X2X1S=X1X1S

X1 e sono combinazioni lineari di , quindi lo sono anche . Sono congiuntamente gaussiani, non correlati (provalo) e indipendenti.X2zX2,X1S

La decomposizione vale con

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

Quindi

X1|X2N(X1S,(1ρ)2σX12).

Due variabili casuali univariate gaussiane sono congiuntamente gaussiane se i condizionali e sono gaussiani.X,YX|YY|X


2
Non è chiaro come questa osservazione risponda alla domanda. Poiché la regola del prodotto è praticamente la definizione di distribuzione condizionale, non è speciale per le distribuzioni binormali. L'affermazione successiva "then in order ..." non fornisce alcun motivo: esattamente perché anche le distribuzioni condizionali devono essere normali?
whuber

whuber, sto rispondendo alla domanda principale: "Mi chiedo se ci può essere un caso per il quale la probabilità congiunta di due gaussiani non è gaussiana?". Quindi, la risposta è: quando il condizionale non è normale. - Ancillare
accessorio

2
Potresti completare quella dimostrazione? Al momento è solo un'affermazione da parte tua, senza prove. Non è affatto evidente che sia corretto. È anche incompleto, perché è necessario stabilire l'esistenza: vale a dire, è necessario dimostrare che è effettivamente possibile che una distribuzione congiunta abbia margini normali ma per i quali almeno un condizionale non è normale. Ora, infatti, è banalmente vero, perché puoi modificare liberamente ogni distribuzione condizionale di un binormale su un insieme di misura zero senza modificarne i marginali - ma quella possibilità sembrerebbe contraddire le tue affermazioni.
whuber

Ciao @whuber, spero che questo ti aiuti di più. Hai suggerimenti o modifiche da fare? L'ho scritto molto rapidamente poiché al momento non ho molto tempo libero :-), ma apprezzerei qualsiasi suggerimento o miglioramento che puoi apportare. Migliore
accessorio

(1) Cosa stai cercando di dimostrare? (2) Poiché la domanda si pone quando una distribuzione con marginali gaussiani non è congiuntamente gaussiana, non vedo come questo argomento porti a qualcosa di rilevante.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.