Qual è il problema con l'utilizzo di R-quadrato nei modelli di serie storiche?


12

Ho letto che l'uso di R-quadrato per le serie temporali non è appropriato perché in un contesto di serie temporali (so che ci sono altri contesti) R-quadrato non è più unico. Perchè è questo? Ho provato a cercarlo, ma non ho trovato nulla. In genere non attribuisco molto valore all'R-quadrato (o all'R-quadrato rettificato) quando valuto i miei modelli, ma molti miei colleghi (vale a dire Business Majors) sono assolutamente innamorati di R-Squared e voglio essere in grado di spiegare loro perché R-Squared non è appropriato nel contesto delle serie temporali.


3
Ricerca Google: "regressione spuria in econometria". Oppure dai un'occhiata alla carta di Granger e Newbold . Altri possono fornire maggiori dettagli nelle risposte.
Graeme Walsh,

@Richard Hardy potresti per favore approfondire "Se prendiamo il campione R2 come misura della sua controparte di popolazione, si scompone in serie temporali integrate".
Siddharth Krishnamurthy,

Risposte:


18

Alcuni aspetti del problema:

Se qualcuno ci fornisce un vettore di numeri e una matrice conformabile di numeri X , non abbiamo bisogno di sapere qual è la relazione tra loro per eseguire una certa algebra di stima, trattando y come variabile dipendente. L'algebra risulterà, indipendentemente dal fatto che questi numeri rappresentino dati di sezioni trasversali o temporali o dati del pannello, o che la matrice X contenga valori ritardati di y ecc. yXyXy

La definizione fondamentale del coefficiente di determinazione èR2

R2=1SSresSStot

dove è la somma dei residui quadrati da una procedura di stima e S S t o t è la somma delle deviazioni al quadrato della variabile dipendente dalla sua media campionaria.SSresSStot

Combinando, l' sarà sempre calcolata in modo univoco, per un campione di dati specifico, una formulazione specifica della relazione tra le variabili e una procedura di stima specifica, subordinatamente alla condizione che la procedura di stima sia tale da fornire stime puntuali di le quantità sconosciute coinvolte (e quindi le stime puntuali della variabile dipendente, e quindi le stime puntuali dei residui). Se uno di questi tre aspetti cambia, il valore aritmetico di R 2 cambierà in generale, ma questo vale per qualsiasi tipo di dati, non solo per le serie temporali.R2R2

Quindi il problema con e le serie temporali non è se sia "unico" o meno (poiché la maggior parte delle procedure di stima per i dati delle serie temporali fornisce stime puntuali). Il problema è se il "solito" quadro delle specifiche delle serie temporali è tecnicamente amichevole per R 2 e se R 2 fornisce alcune informazioni utili. R2R2R2

R2

R2R2previsioni abissali al di fuori del campione.

Intuitivamente, questo compromesso forse contro-intuitivo si verifica perché catturando l'intera variabilità della variabile dipendente in un'equazione stimata, trasformiamo la variabilità non sistematica in sistematica, per quanto riguarda la previsione (qui, "non sistematico" dovrebbe essere compreso rispetto alla nostra conoscenza da un punto di vista filosofico puramente deterministico, non esiste una "variabilità non sistematica", ma nella misura in cui la nostra conoscenza limitata ci costringe a trattare una certa variabilità come "non sistematica", quindi il tentativo di trasformarla in una sistematica componente, porta il disastro di previsione).

R2R21


Buona spiegazione, ma allora perché questo viene aggiunto come output standard del software nel pacchetto statistico

@brijesh Regressione-tradizione, direi.
Alecos Papadopoulos,

R2
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.