La correlazione misura la relazione lineare. Nel contesto informale la relazione significa qualcosa di stabile. Quando calcoliamo la correlazione del campione per le variabili stazionarie e aumentiamo il numero di punti dati disponibili, questa correlazione del campione tende alla vera correlazione.
Si può dimostrare che per i prezzi, che di solito sono passeggiate casuali, la correlazione del campione tende a una variabile casuale. Ciò significa che, indipendentemente da quanti dati abbiamo, il risultato sarà sempre diverso.
Nota che ho provato ad esprimere l'intuizione matematica senza la matematica. Dal punto di vista matematico la spiegazione è molto chiara: i momenti di esempio di processi stazionari convergono in probabilità in costanti. I momenti di esempio di camminate casuali convergono in integrali di moto browniano che sono variabili casuali. Poiché la relazione viene solitamente espressa come un numero e non come una variabile casuale, diventa evidente la ragione per cui non si calcola la correlazione per variabili non stazionarie.
Aggiornamento Poiché siamo interessati alla correlazione tra due variabili, assumiamo innanzitutto che provengano dal processo stazionario . La stazionarietà implica che e non dipendono da . Quindi correlazioneE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt)EZtcov(Zt,Zt−h)t
corr(Xt,Yt)=cov(Xt,Yt)DXtDYt−−−−−−−√
inoltre non dipende da , poiché tutte le quantità nella formula provengono da matrice , che non dipende da . Quindi il calcolo della correlazione del campionec o v ( Z t ) ttcov(Zt)t
ρ=corr(Xt,Yt)ρ→ρT→∞√
ρ^=1T∑Tt=1(Xt−X¯)(Yt−Y¯)1T2∑Tt=1(Xt−X¯)2∑Tt=1(Yt−Y¯)2−−−−−−−−−−−−−−−−−−−−−−−−−−−√
ha senso, dal momento che potremmo avere ragionevoli speranze che la correlazione del campione . Si scopre che questa speranza non è infondata, poiché per i processi stazionari che soddisfano determinate condizioni abbiamo che , come in probabilità. Inoltre nella distribuzione, in modo da poter testare le ipotesi su .
ρ=corr(Xt,Yt)ρ^→ρT→∞ρT−−√(ρ^−ρ)→N(0,σ2ρ)ρ
Supponiamo ora che non sia fermo. Quindi può dipendere da . Quindi, quando osserviamo un campione di dimensione potremmo possibilmente stimare correlazioni diverse . Questo è ovviamente impossibile, quindi nel migliore dei casi possiamo solo stimare alcune funzionalità di come media o varianza. Ma il risultato potrebbe non avere un'interpretazione sensata. c o r r ( X t , Y t ) t T T ρ t ρ tZtcorr(Xt,Yt)tTTρtρt
Esaminiamo ora cosa succede con la correlazione della camminata casuale di processo non stazionario probabilmente più studiata. Chiamiamo il processo una camminata casuale se , dove è un processo stazionario. Per semplicità supponiamo che . PoiZ t = ∑ t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt)Zt=∑ts=1(Ut,Vt)Ct=(Ut,Vt)ECt=0
corr(XtYt)=EXtYtDXtDYt−−−−−−−√=E∑ts=1Ut∑ts=1VtD∑ts=1UtD∑ts=1Vt−−−−−−−−−−−−−−−−√
Per semplificare ulteriormente le cose, supponiamo che sia un rumore bianco. Ciò significa che tutte le correlazioni sono zero per . Si noti che ciò non limita a zero.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)
Quindi
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
Fin qui tutto bene, sebbene il processo non sia stazionario, la correlazione ha un senso, anche se abbiamo dovuto fare le stesse ipotesi restrittive.
Ora, per vedere cosa succede alla correlazione campionaria, dovremo usare il fatto seguente sulle passeggiate casuali, chiamato teorema del limite centrale funzionale:
s∈[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
nella distribuzione, dove e è bivariato
Moto browniano (processo di salciccia bidimensionale). Per comodità introdurre la definizione .
s∈[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))−1/2Ws
Ancora una volta, per semplicità, definiamo la correlazione del campione come
ρ^=1T∑Tt=1XtYt1T∑Tt=1X2t1T∑Tt=1Y2t−−−−−−−−−−−−−−−−−−√
Cominciamo con le variazioni. abbiamo
E1T∑t=1TX2t=1TE∑t=1T(∑s=1tUt)2=1T∑t=1Ttσ2U=σUT+12.
Questo va all'infinito all'aumentare di , quindi si incontra il primo problema, la varianza del campione non converge. D'altra parte, il teorema della mappatura continua in combinazione con il teorema del limite centrale funzionale ci dàT
T→∞
1T2∑t=1TX2t=∑t=1T1T(1T−−√∑s=1tUt)2→∫10M21sds
dove la convergenza è convergenza nella distribuzione, come .
T→∞
Allo stesso modo otteniamo
1
1T2∑t=1TY2t→∫10M22sds
e
1T2∑t=1TXtYt→∫10M1sM2sds
Quindi finalmente per la correlazione campionaria della nostra camminata casuale otteniamo
ρ^→∫10M1sM2sds∫10M21sds∫10M22sds−−−−−−−−−−−−−−−√
nella distribuzione come .
T→∞
Quindi, sebbene la correlazione sia ben definita, la correlazione del campione non converge verso di essa, come nel caso del processo stazionario. Invece converge in una certa variabile casuale.