Perché mai usare Durbin-Watson invece di testare l'autocorrelazione?

10

Il test di Durbin-Watson verifica l'autocorrelazione dei residui allo sfasamento 1. Ma allo stesso modo verifica l'autocorrelazione allo sfasamento 1 direttamente. Inoltre, puoi testare l'autocorrelazione al ritardo 2,3,4 e ci sono buoni test portmanteau per l'autocorrelazione a più ritardi e ottenere grafici piacevoli e facilmente interpretabili [ad esempio la funzione acf () in R]. Durbin-Watson non è intuitivo da capire e spesso produce risultati inconcludenti. Quindi perché mai usarlo?

Ciò è stato ispirato da questa domanda sull'incongruenza di alcuni test di Durbin-Watson, ma è chiaramente separato da esso.

time-series autocorrelation

— zbicyclist
fonte

1

In realtà puoi fare Durbin-Watson per altri ritardi. Cerca le statistiche generalizzate di Durbin-Watson.

— Brandon Sherman,

8

Come sottolineato prima in questo e in altri thread: (1) Il test di Durbin-Watson non è inconcludente. Solo i limiti suggeriti inizialmente da Durbin e Watson erano perché la distribuzione precisa dipende dalla matrice del regressore osservata. Tuttavia, questo è abbastanza facile da affrontare nel software statistico / econometrico ormai. (2) Esistono generalizzazioni del test Durbin-Watson a ritardi maggiori. Quindi né l'incongruenza né la limitazione dei ritardi sono argomenti contro il test di Durbin-Watson.

Rispetto al test Wald della variabile dipendente ritardata, il test Durbin-Watson può avere una potenza maggiore in alcuni modelli. In particolare, se il modello contiene tendenze deterministiche o modelli stagionali, può essere meglio testare l'autocorrelazione nei residui (come fa il test di Durbin-Watson) rispetto all'inclusione della risposta ritardata (che non è ancora regolata per i modelli deterministici) . Di seguito includo una piccola simulazione R.

Un importante svantaggio del test Durbin-Watson è che non deve essere applicato a modelli che già contengono effetti autoregressivi. Pertanto, non è possibile verificare la rimanente autocorrelazione dopo averla parzialmente catturata in un modello autoregressivo. In quello scenario, la potenza del test di Durbin-Watson può ridursi completamente, mentre per il test di Breusch-Godfrey, ad esempio, non lo è. Il nostro libro "Applied Econometrics with R" ha un piccolo studio di simulazione che lo mostra nel capitolo "Programmazione della tua analisi", vedi http://eeecon.uibk.ac.at/~zeileis/teaching/AER/ .

Per un set di dati con tendenza più errori autocorrelati, tuttavia, la potenza del test Durbin-Watson è maggiore rispetto a quella del test Breusch-Godfrey e anche più elevata rispetto al test Wald di effetto autoregressivo. Lo illustro per un semplice piccolo scenario in R. Traggo 50 osservazioni da un tale modello e calcolo i valori p per tutti e tre i test:

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

Quindi possiamo simulare 1000 valori p per tutti e tre i modelli:

set.seed(1)
p <- t(replicate(1000, pvals()))

Il test Durbin-Watson porta ai valori p medi più bassi

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220

e la massima potenza al livello di significatività del 5%:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248

— Achim Zeileis
fonte

Pertanto, un'altra limitazione della statistica DW è che non può essere utilizzata se il modello tenta già di controllare l'autocorrelazione. Apprezzo il fatto che il DW abbia più potenza di Wald o Breusch-Godfrey (nessuno dei quali ho usato), ma il mio solito confronto è con un test portmanteau come Ljung-Box e le singole autocorrelazioni rispetto a un valore nullo di 0. Questo è un regime tipico nella previsione dei libri di testo.

— zbicyclist,

2

Non è davvero un'altra limitazione dell'IMO ma la principale limitazione. Le altre questioni (calcolo dei valori p piuttosto che limiti e numero di ritardi) possono essere affrontate. E fai attenzione all'interpretazione della potenza: ho detto che in questo particolare modello - tendenza deterministica con termine di errore AR (1) - il test di Durbin-Watson ha una potenza maggiore. Questo potrebbe non essere il caso in molte altre configurazioni. E per quanto riguarda il test Ljung-Box: Sì, questo è il test classico per verificare la rimanente autocorrelazione dopo aver montato un modello ARIMA.

— Achim Zeileis,

3

Il test Durbin-Watson è il modo in cui testare l'autocorrelazione. Tracciare un ACF è come fare un diagramma QQ per verificare la normalità. Essere in grado di controllare un diagramma QQ per verificare la normalità è utile, ma un test di Kolmogorov-Smirnov o Levene completa ciò che vedi nella trama perché un test di ipotesi per la normalità è più conclusivo.

Per quanto riguarda i ritardi multipli, è possibile utilizzare una statistica Durbin-Watson generalizzata, eseguire alcuni test di ipotesi ed eseguire una correzione di Bonferroni per correggere i test multipli. Potresti anche eseguire un test Breusch-Godfrey , che verifica la presenza di una correlazione di qualsiasi ordine.

— Brandon Sherman
fonte