Vincolato per la correlazione di tre variabili casuali


28

Esistono tre variabili casuali, . Le tre correlazioni tra le tre variabili sono le stesse. Questo è,x,y,z

ρ=cor(x,y)=cor(x,z)=cor(y,z)

Qual è il limite più stretto che puoi dare a ρ ?


1
Presumibilmente con "pho", intendi rho ( ρ ). Tuttavia, la tua domanda non è chiara. Cosa intendi con "Qual è il limite più stretto che puoi dare"?
gung - Ripristina Monica

Bene, il nome della variabile è solo un manichino. Per limite più stretto, intendo qualcosa come [-1, 1] per una correlazione, ma questo chiaramente non è il limite più stretto possibile.
user1352399

Vuoi dire che rho = cor (x, y) = cor (x, z) = cor (y, z), e quali sono i limiti di rho?
user31264,

Sì, intendo che rho = cor (x, y) = cor (x, z) = cor (y, z) e quali sono i limiti di rho. Dilip, puoi estenderlo per dire che rho deve essere non negativo, cioè> = 0?
user1352399

1
Un libro di testo da citare per questo è Seber & Lee "Linear Regression Analysis" (almeno era nella prima edizione ...)
kjetil b halvorsen,

Risposte:


29

La correlazione comune può avere valore ma non . Se , allora non può essere uguale a ma in realtà è . Il valore più piccolo della correlazione comune di tre variabili casuali è . Più in generale, la correlazione minima comune di variabili casuali è quando, considerati come vettori, si trovano ai vertici di un simplex (di dimensione ) nello spazio -dimensionale.+ 1 - 1 ρ X , Y = ρ X , Z = - 1 ρ Y , Z - 1 + 1 - 1ρ+11ρX,Y=ρX,Z=1ρY,Z1+1 n-112n n-1n1n1n1n

Considera la varianza della somma delle variabili casuali varianza unità . Abbiamo che dove è la media valore dei coefficienti di correlazione . Ma poiché , otteniamo prontamente da quel X i var ( n i = 1 X i )nXi ˉ ρ ( n

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯ var(iXi)0(1) ˉ ρ-1(n2)var(iXi)0(1)
ρ¯1n1.

Quindi, il valore medio di un coefficiente di correlazione è almeno . Se tutti i coefficienti di correlazione hanno lo stesso valore , allora anche la loro media è uguale a e quindi abbiamo quel È possibile avere variabili casuali per le quali il valore di correlazione comune uguale a ? Sì. Supponiamo che gli siano variabili casuali di varianza unitaria non correlate e impostate . Quindi, , mentre ρρρ-11n1ρρρ-1

ρ1n1.
ρ XiYi=Xi-11n1Xi E[Yi]=0var(Yi)= ( n - 1Yi=Xi1nj=1nXj=XiX¯E[Yi]=0 cov(Yi,Yj)=-2(n-1
var(Yi)=(n1n)2+(n1)(1n)2=n1n
e dà Quindi sono variabili casuali che raggiungono il valore minimo comune di correlazione di . Si noti, per inciso, che , e quindi, considerati vettori, le variabili casuali si trovano in un iperpiano dimensionale di ρYi,Yj=cov(Yi,Yj)
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
i-1
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
YiiYi=0(n-1)n1n1iYi=0(n1)nspazio tridimensionale.

25

Il limite più stretto possibile è . 1/2ρ1 Tutti questi valori possono effettivamente apparire - nessuno è impossibile.

Per mostrare che non c'è nulla di particolarmente profondo o misterioso nel risultato, questa risposta presenta innanzitutto una soluzione completamente elementare, che richiede solo il fatto ovvio che le varianze - essendo i valori attesi dei quadrati - devono essere non negativi. Questa è seguita da una soluzione generale (che utilizza fatti algebrici leggermente più sofisticati).

Soluzione elementare

La varianza di qualsiasi combinazione lineare di deve essere non negativa. x,y,z Lascia che le varianze di queste variabili siano rispettivamente e . Tutti sono diversi da zero (altrimenti non verrebbero definite alcune delle correlazioni). Usando le proprietà di base delle varianze possiamo calcolareυ 2σ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

per tutti i numeri reali .(α,β,γ)

Supponendo , una piccola manipolazione algebrica implica che ciò equivale aα+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

Il termine quadrato sul lato destro è il rapporto tra due mezzi di potenza di . La disuguaglianza elementare media potenza (con pesi ) afferma che il rapporto non può superare (e sarà uguale a quando ). Un po 'più di algebra implica quindi( 1 / 3 , 1 / 3 , 1 / 3 ) 1 1 α = β = γ 0(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

L'esempio esplicito di seguito (che coinvolge variabili normali banali ) mostra che tutti questi valori, , nascono effettivamente come correlazioni. In questo esempio viene utilizzata solo la definizione di normali multivariati, ma in caso contrario non viene richiamato alcun risultato di calcolo o algebra lineare.( x , y , z ) - 1 / 2 P 1n=3(x,y,z)1/2ρ1

Soluzione generale

Panoramica

Qualsiasi matrice di correlazione è la matrice di covarianza delle variabili casuali standardizzate, per cui - come tutte le matrici di correlazione - deve essere semi-definita positiva. Equivalentemente, i suoi autovalori sono non negativi. Ciò impone una condizione semplice su : non deve essere inferiore a (e ovviamente non può superare ). Al contrario, tale effettivamente corrisponde alla matrice di correlazione di qualche distribuzione trivariata, dimostrando questi limiti sono il più stretto possibile.- 1 / 2 1 ρρ1/21ρ


Derivazione delle condizioni suρ

Considera la matrice di correlazione per con tutti i valori off-diagonali uguali a(La domanda riguarda il caso ma questa generalizzazione non è più difficile da analizzare.) Chiamiamolo Per definizione, è un autovalore di purché esista un vettore diverso da zero tale chen ρ . n = 3 , C ( ρ , n ) . λ x λnnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

Questi autovalori sono facili da trovare nel caso presente, perché

  1. Lasciando , calcola quello1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. Lasciando con un solo nella posizione (per ), calcola quelloyj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

Dato che gli autovettori trovati finora occupano l'intero spazio dimensionale (prova: una facile riduzione di riga mostra il valore assoluto del loro determinante uguale a , che è diverso da zero), costituiscono una base di tutti gli autovettori. Abbiamo quindi trovato tutti gli autovalori e determinato che sono o (quest'ultimo con molteplicità ). Oltre alla ben nota disuguaglianza soddisfatta da tutte le correlazioni, la non negatività del primo autovalore implica ulteriormentennn1+(n1)ρ1ρn11ρ1

ρ1n1

mentre la non negatività del secondo autovalore non impone nuove condizioni.


Prova di sufficienza delle condizioni

Le implicazioni funzionano in entrambe le direzioni: purché la matrice è definita non negativa e quindi è una matrice di correlazione valida. È, ad esempio, la matrice di correlazione per una distribuzione multinormale. In particolare, scrivi1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

per l'inverso di quando Ad esempio, quandoC(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

Lascia che il vettore di variabili casuali abbia una funzione di distribuzione(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

dove . Ad esempio, quando ugualex=(x1,x2,,xn)n=3

1(2π)3(1ρ)2(1+2ρ)exp((1+ρ)(x2+y2+z2)2ρ(xy+yz+zx)2(1ρ)(1+2ρ)).

La matrice di correlazione per queste variabili casuali ènC(ρ,n).

figura

Contorni delle funzioni di densità Da sinistra a destra, . Nota come la densità si sposta dalla concentrazione vicino al piano alla concentrazione vicino alla linea .fρ,3.ρ=4/10,0,4/10,8/10x+y+z=0x=y=z

I casi speciali e possono anche essere realizzati con distribuzioni degenerate ; Non entrerò nei dettagli se non per sottolineare che nel primo caso la distribuzione può essere considerata supportata sull'hyperplane , dove è una somma di media identicamente distribuita- Distribuzione normale, mentre in quest'ultimo caso (perfetta correlazione positiva) è supportata sulla linea generata da , dove ha una distribuzione normale pari a .ρ=1/(n1)ρ=1x.1=0010


Maggiori informazioni sulla non degenerazione

Una revisione di questa analisi chiarisce che la matrice di correlazione ha un rango di e ha un rango di (perché solo un autovettore ha un autovalore diverso da zero). Per , ciò rende degenerata la matrice di correlazione in entrambi i casi. Altrimenti, l'esistenza del suo inverso dimostra che non è generosa.n - 1 C (C(1/(n1),n)n1C(1,n)1n2Σ(ρ,n)


20

La tua matrice di correlazione è

(1ρρρ1ρρρ1)

La matrice è semidefinita positiva se i principali minori principali sono tutti non negativi. I principali minori sono i determinanti dei blocchi "nord-ovest" della matrice, ovvero 1, il determinante di

(1ρρ1)

e il determinante della matrice di correlazione stessa.

1 è ovviamente positivo, il secondo minore minore è , che non è negativo per qualsiasi correlazione ammissibile . Il determinante dell'intera matrice di correlazione è1ρ2ρ[1,1]

2ρ33ρ2+1.

Il diagramma mostra il determinante della funzione nell'intervallo di correlazioni ammissibili . [1,1]inserisci qui la descrizione dell'immagine

Vedi la funzione non è negativa nell'intervallo dato da @stochazesthai (che puoi anche verificare trovando le radici dell'equazione determinante).


Non stiamo assumendo nella tua risposta che ? Perché possiamo Var()=1
Un vecchio nel mare.

1
@Anold Sembra che tu stia leggendo "covarianza" in cui è scritta "correlazione".
whuber

6

Esistono variabili casuali , e con correlazioni a coppie se e solo se la matrice di correlazione è semidefinita positiva. Questo succede solo per .Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ [ - 1XYZρXY=ρYZ=ρXZ=ρρ[12,1]


2
puoi spiegarlo in termini molto semplici.
Elizabeth Susan Joseph

1
Non penso che esista una spiegazione che non richiede la conoscenza dell'algebra matriciale. Ti consiglio di guardare la pagina di Wikipedia ( en.wikipedia.org/wiki/… ).
Stochazesthai,

4
Ho trovato una spiegazione che richiede solo l'algebra di base (livello superiore) e l'ho inclusa nella mia risposta.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.