Perché non una solida regressione ogni volta?


12

Esempi di questa pagina mostrano che la semplice regressione è notevolmente influenzata dai valori erratici e questo può essere superato con tecniche di regressione robusta: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Credo che lmrob e ltsReg siano altre solide tecniche di regressione.

Perché non si dovrebbe fare una regressione solida (come rlm o rq) ogni volta piuttosto che eseguire una regressione semplice (lm)? Ci sono degli svantaggi di queste solide tecniche di regressione? Grazie per la tua comprensione.


2
Questo potrebbe essere utile.
conjugateprior

Risposte:


6

Il teorema di Gauss-Markov :

In un modello lineare con errori sferici (che lungo la strada include un presupposto di nessun valore anomalo, tramite una varianza di errore finita), OLS è efficiente in una classe di stimatori lineari imparziali - ci sono (restrittive, per essere sicuri) condizioni in cui " non puoi fare di meglio di OLS ".


Quindi se non ci sono valori anomali, la regressione lineare sarebbe la migliore. Ma se ci sono, o se altri presupposti vengono violati, solo uno dovrebbe eseguire robuste regressioni. È corretto?
rnso

2
Se ci sono valori anomali, altre tecniche sono migliori, sì. Non vorrei saltare alla conclusione che "se vengono violate altre ipotesi, [...] si dovrebbero eseguire robuste regressioni" - non è una cura per tutte le violazioni. Fx, quando gli errori sono correlati con i regressori e si cercano effetti causali, sono richieste tecniche di variabili strumentali.
Christoph Hanck,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.