Qual è l'importanza della distinzione tra modelli lineari e non lineari? La domanda Modello lineare non lineare o generalizzato: come ti riferisci alla regressione logistica, di Poisson, ecc.? e la sua risposta fu un chiarimento estremamente utile della linearità / non linearità dei modelli lineari generalizzati. Sembra estremamente importante distinguere i modelli lineari da quelli non lineari, ma non mi è chiaro perché? Ad esempio, considera questi modelli di regressione:
Entrambi i modelli 1 e 2 sono lineari e le soluzioni a esistono in forma chiusa, facilmente reperibili utilizzando uno stimatore OLS standard. Non è così per i modelli 3 e 4, che non sono lineari perché (alcuni) i derivati di wrt sono ancora funzioni di .E [ Y ∣ X ] β β
Una semplice soluzione per stimare nel modello 3 è linearizzare il modello impostando , stimare utilizzando un modello lineare e quindi calcolare . γ = β 2 1 γ β 1 = √
Per stimare i parametri nel Modello 4, possiamo supporre che segua una distribuzione binomiale (membro della famiglia esponenziale) e, usando il fatto che la forma logistica del modello è il collegamento canonico, linearizza i rh del modello. Questo è stato il contributo fondamentale di Nelder e Wedderburn .
Ma perché questa non linearità è in primo luogo un problema? Perché non si può semplicemente usare un algoritmo iterativo per risolvere il Modello 3 senza linearizzare usando la funzione radice quadrata o il Modello 4 senza invocare GLM. Sospetto che prima del diffuso potere computazionale, gli statistici stessero provando a linearizzare tutto. Se fosse vero, allora forse i "problemi" introdotti dalla non linearità sono un residuo del passato? Le complicazioni introdotte dai modelli non lineari sono puramente computazionali o esistono altri problemi teorici che rendono i modelli non lineari più difficili da adattare ai dati rispetto ai modelli lineari?