Esempio di due variabili normali * correlate * la cui somma non è normale


10

Sono a conoscenza di alcuni begli esempi di coppie di variabili casuali correlate che sono marginalmente normali ma non congiuntamente normali. Vedi questa risposta di Dilip Sarwate e questa del cardinale .

Sono anche a conoscenza di un esempio di due variabili casuali normali la cui somma non è normale. Vedi questa risposta di Macro . Ma in questo esempio, le due variabili casuali non sono correlate.

Esiste un esempio di due variabili casuali normali che hanno una covarianza diversa da zero e la cui somma non è normale? Oppure è possibile dimostrare che la somma di due variabili casuali normali correlate, anche se non sono normali bivariate, deve essere normale?

[Contesto: ho una domanda a casa che richiede la distribuzione di dove e sono normali standard con correlazione . Penso che la domanda intendesse specificare che sono normali bivariati. Ma mi chiedo se si possa dire qualcosa senza questo presupposto aggiuntivo per diverso da zero.]X Y ρ ρaX+bYXYρρ

Grazie!


5
La risposta del cardinale, che citi, contiene già una soluzione: vedi l'angolo in alto a destra nel suo pannello di esempi.
whuber

Per favore, puoi spiegare come? Specifica una distribuzione congiunta , che produce due marginali normali. Non mi è chiaro che la somma dei due marginali normali non sia normale, ed è quello che sto cercando. (Vedi anche il mio commento sulla risposta di Glen_b di seguito.)
mww

3
Dalla sola immagine è ovvio che la densità della somma a zero è zero (perché la linea interseca il diagramma in un singolo punto, che ha la misura zero), mentre la somma stessa è altrettanto ovviamente simmetrica circa zero, mostrando che zero è il centro della distribuzione della somma. Tale distribuzione non può essere normale perché le distribuzioni normali hanno densità diverse da zero nei loro centri. x+y=0
whuber

Risposte:


12

Quasi ogni copula bivariata produrrà una coppia di variate casuali normali con una correlazione diversa da zero (alcune daranno zero ma sono casi speciali). La maggior parte (quasi tutti) produrrà una somma non normale.

In alcune famiglie di copule può essere prodotta qualsiasi correlazione desiderata (popolazione) di Spearman ; la difficoltà sta solo nel trovare la correlazione di Pearson per i margini normali; è fattibile in linea di principio, ma l'algebra può essere abbastanza complicata in generale. [Tuttavia, se si dispone della correlazione di Spearman della popolazione, la correlazione di Pearson - almeno per i margini di coda leggera come il gaussiano - potrebbe non essere troppo lontana da essa in molti casi.]

Tutti tranne i primi due esempi nella trama del cardinale dovrebbero dare somme non normali.


Alcuni esempi: i primi due appartengono entrambi alla stessa famiglia di copule del quinto esempio di distribuzione bivariata del cardinale, il terzo è degenerato.

Esempio 1:

Clayton copula ( )θ=0.7

istogrammi di margini normali, somma non normale e diagramma della distribuzione bivariata

Qui la somma ha un picco molto distinto e un sbilanciamento abbastanza fortemente corretto

 

Esempio 2:

Clayton copula ( )θ=2

istogrammi di margini normali, somma non normale e diagramma della distribuzione bivariata

Qui la somma è leggermente inclinata. Nel caso non fosse del tutto ovvio per tutti, qui ho capovolto la distribuzione (ovvero abbiamo un istogramma di in viola chiaro) e l'ho sovrapposta in modo da poter vedere l'asimmetria più chiaramente:(x+y)

istogramma sovrapposto di x + y e - (x + y)

 

Potremmo facilmente scambiare la direzione dell'asimmetria della somma in modo che la correlazione negativa sia andata con l'inclinazione a sinistra e la correlazione positiva con l'inclinazione a destra (ad esempio, prendendo e in ciascuno di i casi precedenti: la correlazione delle nuove variabili sarebbe la stessa di prima, ma la distribuzione della somma verrebbe capovolta di 0, invertendo l'asimmetria).X=XY=Y

D'altra parte, se ne negassimo uno, cambieremmo l'associazione tra la forza dell'asimmetria e il segno della correlazione (ma non la sua direzione).

Vale anche la pena di giocare con alcune copule diverse per avere un'idea di cosa può accadere con la distribuzione bivariata e i margini normali.

I margini gaussiani con una t-copula possono essere sperimentati, senza preoccuparsi molto dei dettagli delle copule (generare da bivariata correlata t, che è facile, quindi trasformarsi in margini uniformi tramite la trasformazione integrale di probabilità, quindi trasformare margini uniformi in gaussiano tramite il cdf normale inverso). Avrà una somma non normale ma simmetrica. Quindi, anche se non hai dei bei pacchetti copula, puoi comunque fare alcune cose abbastanza prontamente (ad esempio se stavo provando a mostrare un esempio in modo rapido in Excel, probabilmente inizierei con t-copula).

-

Esempio 3 : (è più simile a quello che avrei dovuto iniziare inizialmente)

Considera una copula basata su un'uniforme standard , e lasciando per e per . Il risultato ha margini uniformi per e , ma la distribuzione bivariata è degenerata. Trasformando entrambi i margini nella normale otteniamo una distribuzione per simile a questa:UV=U0U<12V=32U12U1UVX=Φ1(U),Y=Φ1(V)X+Y

inserisci qui la descrizione dell'immagine

In questo caso la correlazione tra loro è di circa 0,66.

Quindi, ancora una volta, e sono normali correlate con una somma (in questo caso distintamente) non normale - perché non sono normali bivariati.YXY

[Si potrebbe generare un intervallo di correlazioni lanciando il centro di (in , per in ), per ottenere . Questi avrebbero un picco a 0 quindi uno spazio ai lati, con code normali.]( 1Uc[0,1(12c,12+c)cV[0,12]V


Qualche codice:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

Il secondo esempio:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Codice per il terzo esempio:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)

Grazie - ma se non sbaglio, è anche normale. (Quando , otteniamo , e quando , otteniamo . Quindi con probabilità 1 otteniamo la somma di due normali standard indipendenti, il che è normale.) Sto cercando un caso in cui la somma di due normali correlati non è normale, piuttosto che un caso in cui la distribuzione articolare non è normale. I = 0 U + V I = 1 2 ZX+Y=2IZ+(1I)U+(1I)VI=0U+VI=12Z
mww

Abbastanza bene - attraverso i miei vari tentativi di fare un esempio non bivariato-normale in cui potevo scegliere la correlazione, da qualche parte lungo la linea ho smesso di controllare che la somma non fosse normale. Sostituirò l'esempio con qualcosa in cui dimostrerò una somma non normale, ma non avrà la possibilità di selezionare direttamente . Aspetta, potrebbero volerci circa un'ora prima che ci riesca. ρ
Glen_b -Restate Monica

Ho sostituito l'esempio con due esempi specifici usando le copule di Clayton
Glen_b -Reinstate Monica,

Favoloso - grazie! Grazie soprattutto per il codice R.
mww

Ho aggiunto un terzo esempio e alla fine delineo un modo per ottenere qualcosa di simile a quello che stavo tentando originariamente - un modo per ottenere una correlazione sintonizzabile tra -1 e 1 (a parte casi speciali alle estremità), ma per i quali la somma non è normale.
Glen_b -Restate Monica

-1

Ho trovato un esempio. X è una variabile normale standard e Y = -X. Quindi X + Y = 0, che è costante. Qualcuno può confermare che è un controesempio?

Sappiamo che se X, Y sono congiuntamente normali, allora anche la loro somma è normale. E se la loro correlazione fosse -1 ??

Sono un po 'confuso su questo. Grazie.


Ottieni la stessa cosa è vera quando X = Y e poi XY = 0. Queste sono distribuzioni normali che non sono normali bivariate. Quindi la proprietà che le combinazioni lineari di sono normali che si applica alla normale bivariata non ha bisogno di essere applicata.
Michael R. Chernick,

@Zirui IMO è un caso degenerato del normale ( ) piuttosto che un controesempio diretto, anche se dipende dalle tue definizioni. σ0
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.