Esempi di vita reale di differenza tra indipendenza e correlazione


9

È noto che l'indipendenza delle variabili casuali implica una correlazione zero, ma la correlazione zero non implica necessariamente l'indipendenza.

Mi sono imbattuto in molti esempi matematici che dimostrano dipendenza nonostante zero correlazione. Ci sono esempi di vita reale a supporto di questo fatto?


2
Attenzione, solo zero correlazione e variabili congiuntamente normali implicano l'indipendenza.
Francis

2
@Siddesh "Ma poiché il volume non è una funzione lineare della lunghezza, non sono correlati." Bene, non perfettamente correlato. Ma sarebbero correlati positivamente.
Silverfish

1
@Siddhesh: funzionerà solo se E[length4]-E[length]E[length3]=0 ...
Francis

1
Sentiti libero di inserire nuovamente il commento sulla distribuzione normale se non sei d'accordo con la mia modifica. Ma ho pensato che sarebbe stato meglio rimuoverlo dal momento che (1) è un problema secondario di distrazione per la tua domanda principale, (2) è stato (credo) già richiesto su CV prima quindi sarebbe un duplicato del materiale esistente qui ( 3) Non volevo che causasse confusione tra i futuri lettori. Ho cercato di modificare la domanda in modo tale da aumentare le possibilità di riapertura: penso che questa domanda sia abbastanza distinta da quelle "statistiche matematiche" sullo stesso argomento.
Silverfish

2
Penso ancora che questa domanda sia davvero piacevole e potrebbe attirare ulteriori risposte interessanti se potesse essere riaperta (il che potrebbe comportare alcune modifiche per distinguerla chiaramente dal thread di cui è attualmente considerato un duplicato). Ho sollevato una discussione su Meta su ciò che sarebbe necessario per riaprire questa domanda. Tutti i commenti sono benvenuti.
Silverfish

Risposte:


6

I rendimenti azionari sono un discreto esempio di vita reale di ciò che stai chiedendo. C'è una correlazione molto vicina allo zero tra il ritorno S&P 500 di oggi e di ieri. Tuttavia, esiste una chiara dipendenza: i rendimenti quadrati sono autocorrelati positivamente; i periodi di elevata volatilità sono raggruppati nel tempo.

Codice R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

La serie temporale dei registri ritorna sull'S & P 500:

registrazione delle tempistiche di ritorno

Se i rendimenti fossero indipendenti nel tempo (e stazionari), sarebbe molto improbabile vedere quei modelli di volatilità raggruppata e non si vedrebbe autocorrelazione nei ritorni dei registri quadrati.


3

Un altro esempio è la relazione tra stress e voti in un esame. La relazione è una forma a U inversa e la correlazione è molto bassa anche se la causalità sembra abbastanza chiara.


2
Questo è un esempio chiaro. Hai dei dati o questo basato solo sull'esperienza di introspezione / insegnamento?
Adrian

1
Ho visto uno studio su questo, ma l'ho visto molti anni fa, quindi non ho la citazione o i dati effettivi.
Peter Flom
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.