Esistono tre variabili casuali, . Le tre correlazioni tra le tre variabili sono le stesse. Questo è,
Qual è il limite più stretto che puoi dare a ?
Esistono tre variabili casuali, . Le tre correlazioni tra le tre variabili sono le stesse. Questo è,
Qual è il limite più stretto che puoi dare a ?
Risposte:
La correlazione comune può avere valore ma non . Se , allora non può essere uguale a ma in realtà è . Il valore più piccolo della correlazione comune di tre variabili casuali è . Più in generale, la correlazione minima comune di variabili casuali è quando, considerati come vettori, si trovano ai vertici di un simplex (di dimensione ) nello spazio -dimensionale.+ 1 - 1 ρ X , Y = ρ X , Z = - 1 ρ Y , Z - 1 + 1 - 1 n-1 n-1n
Considera la varianza della somma delle variabili casuali varianza unità . Abbiamo che dove è la media valore dei coefficienti di correlazione . Ma poiché , otteniamo prontamente da quel X i var ( n ∑ i = 1 X i ) ˉ ρ ( n
Quindi, il valore medio di un coefficiente di correlazione è almeno . Se tutti i coefficienti di correlazione hanno lo stesso valore , allora anche la loro media è uguale a e quindi abbiamo quel È possibile avere variabili casuali per le quali il valore di correlazione comune uguale a ? Sì. Supponiamo che gli siano variabili casuali di varianza unitaria non correlate e impostate . Quindi, , mentre ρρρ≥-1ρ-1
Il limite più stretto possibile è . Tutti questi valori possono effettivamente apparire - nessuno è impossibile.
Per mostrare che non c'è nulla di particolarmente profondo o misterioso nel risultato, questa risposta presenta innanzitutto una soluzione completamente elementare, che richiede solo il fatto ovvio che le varianze - essendo i valori attesi dei quadrati - devono essere non negativi. Questa è seguita da una soluzione generale (che utilizza fatti algebrici leggermente più sofisticati).
La varianza di qualsiasi combinazione lineare di deve essere non negativa. Lascia che le varianze di queste variabili siano rispettivamente e . Tutti sono diversi da zero (altrimenti non verrebbero definite alcune delle correlazioni). Usando le proprietà di base delle varianze possiamo calcolareυ 2
per tutti i numeri reali .
Supponendo , una piccola manipolazione algebrica implica che ciò equivale a
Il termine quadrato sul lato destro è il rapporto tra due mezzi di potenza di . La disuguaglianza elementare media potenza (con pesi ) afferma che il rapporto non può superare (e sarà uguale a quando ). Un po 'più di algebra implica quindi( 1 / 3 , 1 / 3 , 1 / 3 ) 1 1 α = β = γ ≠ 0
L'esempio esplicito di seguito (che coinvolge variabili normali banali ) mostra che tutti questi valori, , nascono effettivamente come correlazioni. In questo esempio viene utilizzata solo la definizione di normali multivariati, ma in caso contrario non viene richiamato alcun risultato di calcolo o algebra lineare.( x , y , z ) - 1 / 2 ≤ P ≤ 1
Qualsiasi matrice di correlazione è la matrice di covarianza delle variabili casuali standardizzate, per cui - come tutte le matrici di correlazione - deve essere semi-definita positiva. Equivalentemente, i suoi autovalori sono non negativi. Ciò impone una condizione semplice su : non deve essere inferiore a (e ovviamente non può superare ). Al contrario, tale effettivamente corrisponde alla matrice di correlazione di qualche distribuzione trivariata, dimostrando questi limiti sono il più stretto possibile.- 1 / 2 1 ρ
Considera la matrice di correlazione per con tutti i valori off-diagonali uguali a(La domanda riguarda il caso ma questa generalizzazione non è più difficile da analizzare.) Chiamiamolo Per definizione, è un autovalore di purché esista un vettore diverso da zero tale chen ρ . n = 3 , C ( ρ , n ) . λ x λ
Questi autovalori sono facili da trovare nel caso presente, perché
Lasciando , calcola quello
Lasciando con un solo nella posizione (per ), calcola quello
Dato che gli autovettori trovati finora occupano l'intero spazio dimensionale (prova: una facile riduzione di riga mostra il valore assoluto del loro determinante uguale a , che è diverso da zero), costituiscono una base di tutti gli autovettori. Abbiamo quindi trovato tutti gli autovalori e determinato che sono o (quest'ultimo con molteplicità ). Oltre alla ben nota disuguaglianza soddisfatta da tutte le correlazioni, la non negatività del primo autovalore implica ulteriormente
mentre la non negatività del secondo autovalore non impone nuove condizioni.
Le implicazioni funzionano in entrambe le direzioni: purché la matrice è definita non negativa e quindi è una matrice di correlazione valida. È, ad esempio, la matrice di correlazione per una distribuzione multinormale. In particolare, scrivi
per l'inverso di quando Ad esempio, quando
Lascia che il vettore di variabili casuali abbia una funzione di distribuzione
dove . Ad esempio, quando uguale
La matrice di correlazione per queste variabili casuali è
Contorni delle funzioni di densità Da sinistra a destra, . Nota come la densità si sposta dalla concentrazione vicino al piano alla concentrazione vicino alla linea .
I casi speciali e possono anche essere realizzati con distribuzioni degenerate ; Non entrerò nei dettagli se non per sottolineare che nel primo caso la distribuzione può essere considerata supportata sull'hyperplane , dove è una somma di media identicamente distribuita- Distribuzione normale, mentre in quest'ultimo caso (perfetta correlazione positiva) è supportata sulla linea generata da , dove ha una distribuzione normale pari a .
Una revisione di questa analisi chiarisce che la matrice di correlazione ha un rango di e ha un rango di (perché solo un autovettore ha un autovalore diverso da zero). Per , ciò rende degenerata la matrice di correlazione in entrambi i casi. Altrimenti, l'esistenza del suo inverso dimostra che non è generosa.n - 1 C (
La tua matrice di correlazione è
La matrice è semidefinita positiva se i principali minori principali sono tutti non negativi. I principali minori sono i determinanti dei blocchi "nord-ovest" della matrice, ovvero 1, il determinante di
e il determinante della matrice di correlazione stessa.
1 è ovviamente positivo, il secondo minore minore è , che non è negativo per qualsiasi correlazione ammissibile . Il determinante dell'intera matrice di correlazione è
Il diagramma mostra il determinante della funzione nell'intervallo di correlazioni ammissibili .
Vedi la funzione non è negativa nell'intervallo dato da @stochazesthai (che puoi anche verificare trovando le radici dell'equazione determinante).
Esistono variabili casuali , e con correlazioni a coppie se e solo se la matrice di correlazione è semidefinita positiva. Questo succede solo per .Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ ∈ [ - 1