Cos'è la funzione di autocorrelazione?


16

Qualcuno può spiegare la funzione di autocorrelazione nei dati di una serie temporale? Applicando acf ai dati, quale sarebbe l'applicazione?



Nel contesto di serie temporali stazionarie di ampio senso, fornisce una misura della dipendenza di una serie storica dalla sua versione ritardata.
Cagdas Ozgenc,

1
è una misura di quanto il valore corrente è influenzato dai valori precedenti in una serie temporale.
htrahdis,

@htrahdis Come nell'impostazione di regressione standard, fare attenzione a non correlare correlazione con influenza (o causalità).
whuber

@Andy Quel thread sembra davvero simile - grazie per averlo localizzato - ma la risposta accettata (e unica) non affronta direttamente questa domanda: si concentra su un particolare acf. In quanto tale, fornisce un'illustrazione di come interpretare l'acf, ma non mi è chiaro se qualcuno di quel materiale risponda alla presente richiesta di spiegazione degli ACF in generale.
whuber

Risposte:


31

A differenza dei normali dati di campionamento, vengono ordinati i dati delle serie temporali. Pertanto, sono disponibili ulteriori informazioni sull'esempio di cui è possibile trarre vantaggio, se esistono utili schemi temporali. La funzione di autocorrelazione è uno degli strumenti utilizzati per trovare modelli nei dati. In particolare, la funzione di autocorrelazione indica la correlazione tra punti separati da vari ritardi temporali. Ad esempio, ecco alcuni possibili valori della funzione acf per una serie con periodi di tempo discreti:

La notazione è ACF (n = numero di periodi di tempo tra punti) = correlazione tra punti separati da n periodi di tempo. Ill darò esempi per i primi pochi valori di n.

ACF (0) = 1 (tutti i dati sono perfettamente correlati con se stessi), ACF (1) =. 9 (la correlazione tra un punto e il punto successivo è 0.9), ACF (2) =. 4 (la correlazione tra un punto e un punto due volte avanti è 0,4) ... ecc.

Quindi, l'ACF ti dice quanto sono correlati i punti tra loro, in base a quanti passi temporali sono separati. Questo è l'essenza dell'autocorrelazione, è come i punti di dati passati correlati sono a punti di dati futuri, per diversi valori della separazione temporale. In genere, ci si aspetterebbe che la funzione di autocorrelazione scenda verso 0 man mano che i punti diventano più separati (ovvero n diventa grande nella notazione precedente) perché è generalmente più difficile prevedere ulteriormente nel futuro da un determinato set di dati. Questa non è una regola, ma è tipica.

Ora, alla seconda parte ... perché ci importa? L'ACF e la sua funzione sorella, il parzialeLa funzione di autocorrelazione (ne parleremo tra poco), viene utilizzata nell'approccio di modellazione Box-Jenkins / ARIMA per determinare in che modo i punti dati passati e futuri sono correlati in una serie temporale. La funzione di autocorrelazione parziale (PACF) può essere considerata come la correlazione tra due punti che sono separati da un certo numero di periodi n, MA con l'effetto delle correlazioni intermedie rimosse. Questo è importante perché diciamo che in realtà ogni punto dati è direttamente correlato solo con il punto dati SUCCESSIVO e nessun altro. Tuttavia, APPARIRÀ come se il punto corrente fosse correlato con punti ulteriormente nel futuro, ma solo a causa di un effetto di tipo "reazione a catena", cioè T1 è direttamente correlato con T2 che è direttamente correlato con T3, quindi sembra T1 è direttamente correlato con T3. Il PACF rimuoverà la correlazione interveniente con T2 in modo da poter discernere meglio i modelli. Una bella introduzione a questo èQui.

Il manuale di NIST Engineering Statistics, online, ha anche un capitolo su questo e un esempio di analisi delle serie temporali usando autocorrelazione e autocorrelazione parziale. Non lo riprodurrò qui, ma lo esaminerò e dovresti avere una comprensione molto migliore dell'autocorrelazione.


2

lascia che ti dia un'altra prospettiva.

tracciare i valori ritardati di una serie storica con i valori correnti delle serie storiche.

se il grafico che vedi è lineare, significa che esiste una dipendenza lineare tra i valori correnti delle serie temporali rispetto ai valori ritardati delle serie temporali.

i valori di autocorrelazione sono il modo più ovvio per misurare la linearità di quella dipendenza.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.