Semplici esempi di e non correlati ma non indipendenti


26

Ogni studente laborioso è un controesempio di "tutti gli studenti sono pigri".

Quali sono alcuni semplici controesempi a "se le variabili casuali e non sono correlate allora sono indipendenti"?XY


8
Penso che sia un duplicato, ma sono troppo pigro per cercarlo. Prendi e . , ma chiaramente le due variabili non sono indipendenti. XN(0,1)Y=X2cov(X,Y)=EX3=0
mpiktas,

1
un semplice esempio (anche se ce ne sono forse anche più semplici)
Glen_b -Reinstate Monica

1
Prendere da distribuire uniformemente su e , Y = \ sin U . U[0,2π]X=cosUY=sinU
Dilip Sarwate

Poiché il senso di "più semplice" non è definito, questa domanda non è obiettivamente rispondente. Ho scelto il duplicato su stats.stackexchange.com/questions/41317 sulla base della somma più semplice = più piccola di cardinalità dei supporti delle distribuzioni marginali.
whuber

3
@whuber: Anche se "semplice" non è in effetti molto ben definito, le risposte qui, ad esempio la risposta di Glen_b, forniscono chiaramente un esempio molto più semplice rispetto al thread di cui hai chiuso questo come duplicato. Suggerisco di riaprire questo (ho già votato) e forse di renderlo in CW per evidenziare il fatto che "più semplice" è mal definito e che OP sta forse chiedendo vari esempi "semplici".
ameba dice Ripristina Monica

Risposte:


18

Lascia che XU(1,1) .

Sia .Y=X2

Le variabili non sono correlate ma dipendenti.

In alternativa, considera una distribuzione bivariata discreta consistente in probabilità in 3 punti (-1,1), (0, -1), (1,1) con probabilità 1/4, 1/2, 1/4 rispettivamente. Quindi le variabili non sono correlate ma dipendenti.

Considera l'uniforme dei dati bivariata in un diamante (un quadrato ruotato di 45 gradi). Le variabili saranno non correlate ma dipendenti.

Questi sono i casi più semplici che mi vengono in mente.


Tutte le variabili casuali simmetriche e centrate su 0 non sono correlate?
Martin Thoma,

1
@moose La tua descrizione è ambigua. Se vuoi dire "se è simmetrico su zero e è simmetrico su zero" allora no, poiché una normale bivariata con margini normali standard può essere correlata, per esempio. Se intendi "se è simmetrico rispetto a zero e è una funzione pari di ", allora finché esistono varianze credo che la risposta sia sì. Se vuoi dire qualcos'altro dovrai spiegare. Y X Y XXYXYX
Glen_b -Restate Monica

7

Penso che l'essenza di alcuni dei semplici controesempi possa essere vista iniziando con una variabile casuale continua centrata su zero, cioè E [ X ] = 0 . Supponiamo che il pdf di X sia pari e definito su un intervallo del modulo ( - a , a ) , dove a > 0 . Supponiamo ora Y = f ( X ) per alcune funzioni f . Facciamo ora la domanda: per quale tipo di funzioni f ( X ) possiamo avere C oXE[X]=0X(a,a)a>0Y=f(X)ff(X) ?Cov(X,f(X))=0

Sappiamo che . La nostra ipotesi che E [ X ] = 0 ci porta direttamente a C o v ( X , f ( X ) ) = E [ X fCov(X,f(X))=E[Xf(X)]E[X]E[f(X)]E[X]=0 . Denotando il pdf di X via p ( ) , abbiamoCov(X,f(X))=E[Xf(X)]Xp()

.Cov(X,f(X))=E[Xf(X)]=aaxf(x)p(x)dx

Vogliamo e un modo per raggiungere questo obiettivo è garantire che f ( x ) sia una funzione pari, il che implica che x f ( x ) p ( x ) sia una funzione dispari. Segue quindi che a - a x f ( x ) p ( x ) d x = 0 , e quindi C o vCov(X,f(X))=0f(x)xf(x)p(x)aaxf(x)p(x)dx=0 .Cov(X,f(X))=0

In questo modo, si può vedere che la precisa distribuzione di è irrilevante fintanto che il pdf è simmetrico intorno certo punto e qualsiasi funzione anche f ( ) farà per definire Y .Xf()Y

Speriamo che questo possa aiutare gli studenti a capire come le persone escono con questi tipi di controesempi.


5

Sii il controesempio (cioè studente laborioso)! Detto questo:

Stavo cercando di pensare a un esempio del mondo reale e questo è stato il primo che mi è venuto in mente. Questo non sarà il caso matematicamente più semplice (ma se capisci questo esempio, dovresti essere in grado di trovare un esempio più semplice con urne e palline o qualcosa del genere).

Secondo alcune ricerche, il QI medio di uomini e donne è lo stesso, ma la varianza del QI maschile è maggiore della varianza del QI femminile. Per concretezza, diciamo che il QI maschile segue e il QI femminile segue N ( 100 , α σ 2 ) con α < 1 . Metà della popolazione è di sesso maschile e metà della popolazione è di sesso femminile.N(100,σ2)N(100,ασ2)α<1

Supponendo che questa ricerca sia corretta:

Qual è la correlazione di genere e QI?

Il genere e il QI sono indipendenti?


4

Possiamo definire una variabile casuale discreta con P ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1X{1,0,1}P(X=1)=P(X=0)=P(X=1)=13

e quindi definire Y={1,ifX=00,otherwise

Si può facilmente verificare che e Y non siano correlati ma non indipendenti.XY


2

Prova questo (codice R):

x=c(1,0,-1,0);  
y=c(0,1,0,-1);  

cor(x,y);  
[1] 0

Questo è dall'equazione del cerchio x2+y2r2=0

non è correlato a x , ma è funzionalmente dipendente (deterministico). Yx


1
La correlazione zero zero non significa che la correlazione vera sia zero.
mpiktas,

3
@mpiktas Se questi quattro valori rappresentano una distribuzione bivariata ciascuno con probabilità 1/4, la corfunzione che restituisce zero indicherà una correlazione della popolazione pari a zero.
Glen_b -Restate Monica

@Glen_b Avrei dovuto fare commenti migliori sul codice. Questo potrebbe non essere noto a tutti. Puoi usare il punto e virgola se penso che non sia raccomandato come stile di codifica in R.
Analista

1
@Glen_b sì, hai ragione. Ma questo non è stato dichiarato. Bella osservazione tra l'altro.
mpiktas,

1

L'unico caso generale in cui la mancanza di correlazione implica l'indipendenza è quando la distribuzione congiunta di X e Y è gaussiana.


2
Questo non risponde direttamente alla domanda producendo un semplice esempio - in questo senso, è più un commento - ma fornisce una risposta indiretta, in quanto suggerisce una serie molto ampia di possibili esempi. Potrebbe valere la pena riformulare questo post per chiarire come risponde alla domanda originale.
Silverfish,

-1

Una risposta a due frasi: il caso più chiaro di dipendenza statistica non correlata è una funzione non lineare di un camper, diciamo Y = X ^ n. I due camper sono chiaramente dipendenti ma non correlati, poiché la correlazione è una relazione lineare.


A meno che per alcune distribuzioni molto specifiche di , i camper X e Y = X n saranno generalmente correlati. XXY=Xn
StijnDeVuyst,

Questa risposta non è corretta In R: Espressione: {x <- runif (100); cor (x, x ^ 3)} Risultato: 0.9062057
Josh
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.