Il processo di costruzione del modello prevede che un modellista prenda molte decisioni. Una delle decisioni prevede la scelta tra diverse classi di modelli da esplorare. Esistono molte classi di modelli che potrebbero essere considerati; ad esempio, i modelli ARIMA, i modelli ARDL, i modelli Spazio-stato multiplo Sorgente di errore, i modelli LSTAR, i modelli Min-Max, per citarne solo alcuni. Naturalmente, alcune classi di modelli sono più ampie di altre e non è comune scoprire che alcune classi di modelli sono sottoclassi di altre.
Data la natura della domanda, possiamo concentrarci principalmente su solo due classi di modelli; modelli lineari e modelli non lineari .
Con in mente l'immagine sopra, inizierò ad affrontare la questione dei PO su quando è utile adottare un modello non lineare e se esiste un quadro logico per farlo - da una prospettiva statistica e metodologica.
La prima cosa da notare è che i modelli lineari sono una piccola sottoclasse di modelli non lineari. In altre parole, i modelli lineari sono casi speciali di modelli non lineari. Ci sono alcune eccezioni a tale affermazione, ma, ai fini attuali, non perderemo molto accettandolo per semplificare le cose.
In genere, un costruttore di modelli selezionerà una classe di modelli e procederà alla scelta di un modello all'interno di quella particolare classe utilizzando una metodologia. Un semplice esempio è quando si decide di modellare una serie temporale come un processo ARIMA e quindi segue la metodologia Box-Jenkins per selezionare un modello tra la classe dei modelli ARIMA. Lavorare in questo modo, con metodologie associate a famiglie di modelli, è una questione di necessità pratica.
Una conseguenza della decisione di costruire un modello non lineare è che il problema di selezione del modello diventa molto più grande (devono essere considerati più modelli e devono essere prese più decisioni) rispetto alla scelta tra l'insieme più piccolo di modelli lineari, quindi c'è un reale problema pratico a portata di mano. Inoltre, potrebbero non esserci nemmeno metodologie completamente sviluppate (conosciute, accettate, comprese, facili da comunicare) da utilizzare per selezionare alcune famiglie di modelli non lineari. Inoltre, un altro svantaggio della costruzione di modelli non lineari è che i modelli lineari sono più facili da usare e le loro proprietà probabilistiche sono meglio conosciute ( Teräsvirta, Tjøstheim e Granger (2010) ).
Detto questo, il PO richiede motivi statistici per guidare la decisione piuttosto che quelli teorici pratici o di dominio, quindi devo continuare.
Prima ancora di pensare a come affrontare la selezione dei modelli non lineari con cui lavorare, si deve decidere inizialmente se lavorare con modelli lineari o modelli non lineari. Una decisione! Come fare questa scelta?
Facendo appello a Granger e Terasvirta (1993) , adotto il seguente argomento, che ha due punti principali in risposta alle seguenti due domande.
D: Quando è utile costruire un modello non lineare? In breve, può essere utile costruire un modello non lineare quando la classe di modelli lineari è già stata considerata e ritenuta insufficiente per caratterizzare la relazione in esame. Si può dire che questa procedura di modellazione non lineare (processo decisionale) passi da semplice a generale, nel senso che va da lineare a non lineare.
D: Esistono motivi statistici che possono essere utilizzati per giustificare la costruzione di un modello non lineare? Se si decide di costruire un modello non lineare basato sui risultati dei test di linearità, direi di sì, ci sono. Se i test di linearità suggeriscono che non vi è alcuna non linearità significativa nella relazione, non sarebbe consigliabile costruire un modello non lineare; i test dovrebbero precedere la decisione di costruire.
Intenerirò questi punti facendo riferimento diretto a Granger e Terasvirta (1993):
Prima di costruire un modello non lineare è consigliabile scoprire se effettivamente un modello lineare caratterizzerebbe adeguatamente le relazioni [economiche] in analisi. Se così fosse, ci sarebbe più teoria statistica disponibile per la costruzione di un modello ragionevole che se un modello non lineare fosse appropriato. Inoltre, ottenere previsioni ottimali per più di un periodo in avanti sarebbe molto più semplice se il modello fosse lineare. Può accadere, almeno quando le serie temporali sono brevi, che l'investigatore stima con successo un modello non lineare sebbene la vera relazione tra le variabili sia lineare. Il pericolo di complicare inutilmente la costruzione del modello è quindi reale, ma può essere ridotto con i test di linearità.
Nel libro più recente, Teräsvirta, Tjøstheim e Granger (2010), viene dato lo stesso tipo di consiglio, che ora cito:
Dal punto di vista pratico è [quindi] utile testare la linearità prima di tentare la stima del modello non lineare più complicato. In molti casi, i test sono persino necessari da un punto di vista statistico. Numerosi modelli non lineari popolari non vengono identificati in base alla linearità. Se il modello vero che ha generato i dati è lineare e il modello non lineare è interessato a nidificare questo modello lineare, i parametri del modello non lineare non possono essere stimati in modo coerente. Pertanto, i test di linearità devono precedere qualsiasi modellazione e stima non lineari.
Vorrei concludere con un esempio.
Nel contesto della modellizzazione dei cicli economici, un esempio pratico dell'uso di motivi statistici per giustificare la costruzione di un modello non lineare può essere il seguente. Poiché i modelli univariati lineari o autoregressivi vettoriali non sono in grado di generare serie temporali cicliche asimmetriche, vale la pena prendere in considerazione un approccio di modellazione non lineare, in grado di gestire asimmetrie nei dati. Una versione estesa di questo esempio sulla reversibilità dei dati è disponibile in Tong (1993) .
Mi scuso se mi sono concentrato troppo sui modelli di serie storiche. Sono sicuro, tuttavia, che alcune idee sono applicabili anche in altre impostazioni.