Le variabili casuali sono correlate se e solo se i loro ranghi sono correlati?


20

Supponiamo che X,Y siano variabili casuali continue con secondi momenti finiti. La versione della popolazione del coefficiente di correlazione rango di Spearman può essere definita come il coefficiente momento-prodotto ρ di Pearson degli integrali di probabilità trasforma e , dove F_X, F_Y sono i cdf di X e Y , ovvero,F X (X) F Y (Y) F X , F Y XYρSFX(X)FY(Y)FX,FYXY

ρS(X,Y)=ρ(F(X),F(Y)) .

Mi chiedo se si possa generalmente concludere questo

ρ(X,Y)0ρ(F(X),F(Y))0 ?

Cioè, abbiamo una correlazione lineare se e solo se abbiamo una correlazione lineare tra i ranghi?

Aggiornamento: nei commenti vengono forniti due esempi del perché

ρ(FX(X),FY(Y))=0ρ(X,Y)=0

non è vero in generale, anche se X e Y hanno la stessa distribuzione. Quindi la domanda dovrebbe essere riformulata come

ρ(X,Y)=0ρ(FX(X),FY(Y)) ?

È anche di grande interesse per me se questo è vero / falso se X e Y hanno la stessa distribuzione.

(Nota: se X e Y sono positivamente dipendenti dal quadrante, ovvero δ(X,y)=FX,Y(X,y)-FX(X)FY(y)>0 allora la formula di covarianza di Hoeffding Cov(X,Y)=δ(X,y)dXdy produce che ρ(X,Y)>0 e ρ(F(X),F(Y))>0 )


4
Suggerimento: per ottenere una risposta, pensa a ciò che accade a ciascuna misura di correlazione sotto una trasformazione arbitraria strettamente monotona.
cardinale il

1
@cardinal: beh, il rho di spearman è invariante sotto trasformazioni strettamente monotoniche, il coefficiente di correlazione lineare classica cambierà, ma non è chiaro come (?) ... in particolare non so se il valore di correlazione lineare può cambiare il suo valore da zero a diverso da zero sotto trasformazioni strettamente monotoniche ... ma forse ho perso il tuo punto?
FSpanhel,

Sei sulla strada giusta! Sia e . Ora, guarda trasformazioni strettamente monotoniche di questi due. Non ho verificato esplicitamente, ma è probabile che funzioni. X~N(0,1)Y=X2g(z)=exp(-z/2)
cardinale il

2
Hai ragione. Il secondo esempio non funziona come volevo / sospettavo. Tuttavia, il principio generale su come costruire un simile controesempio rimane valido. E sì, questa faccenda può essere strettamente legata alle copule. :-)
cardinale

2
Dopo aver confermato i tuoi controesempi, ti preghiamo di considerare di scriverli in una risposta a questo post. Sarò felice di votarlo. Saluti.
cardinale

Risposte:


8

Nessuna correlazione essendo zero ti dice necessariamente molto sull'altro, dal momento che "ponderano" i dati, specialmente quelli estremi, in modo abbastanza diverso. Ho intenzione di giocare solo con campioni, ma esempi simili potrebbero essere costruiti con distribuzioni / copule bivariate.

1. La correlazione 0 di Spearman non implica la correlazione 0 di Pearson :

Come menzionato nella domanda, ci sono esempi nei commenti, ma la struttura di base è "costruisci un caso in cui la correlazione di Spearman è 0, quindi prendi un punto estremo e rendilo più estremo senza cambiare la correlazione di Spearman"

Gli esempi nei commenti lo coprono molto bene, ma giocherò solo con un esempio più "casuale" qui. Quindi considera questi dati (in R), che per costruzione ha sia la correlazione di Spearman che quella di Pearson 0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

Ora aggiungi 1000 a y [12] e sottrai 0,6 da x [9]; la correlazione di Spearman è invariata ma la correlazione di Pearson ora è 0.1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(Se si desidera un forte significato per quella correlazione di Pearson, è sufficiente replicare l'intero campione più volte).

2. La correlazione 0 di Pearson non implica la correlazione 0 di Spearman :

Ecco due esempi con zero correlazione di Pearson ma correlazione di Spearman diversa da zero (e ancora, se si desidera un forte significato su queste correlazioni di Spearman, è sufficiente replicare l'intero campione più volte).

Esempio 1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699   

punti su una parabola disposti a dare 0 Pearson, ma correlazione di Spearman diversa da zero

Esempio 2:

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

punti sulla linea ay = x, tranne il più piccolo e il più grande che si trovano su y = -x

In questo ultimo esempio, la correlazione di Spearman può essere rafforzata aggiungendo più punti su y = x rendendo i due punti in alto a sinistra e in basso a destra più estremi per mantenere la correlazione di Pearson a 0.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.