Ovviamente i dati non possono essere modificati per adattarsi a una regressione, dovrebbero essere (un po ') al contrario.
Ma a volte i dati hanno cose in corso che necessitano di correzione. Ad esempio, ho ottenuto dati grezzi dall'indagine di Law Enforcement Management and Administrative Statistics 2007. Ho fatto una regressione multipla lineare su di essa usando Stata, quindi ho analizzato i residui e ho trovato l'eteroschedasticità. Quindi l'ho corretto usando l' , robust
opzione nel mio codice di regressione.
A volte i dati hanno altri problemi come i punti dati che sono molto influenti. E a volte i dati non hanno una relazione molto lineare, più curvy. E non so molto sulla regressione, ma penso che ci siano altri possibili problemi con i dati. Forse sondaggi parzialmente compilati o informazioni falsificate.
Ad ogni modo, come faccio a sapere che i dati stessi erano buoni e che invece (se ci fosse un problema) il problema era nella regressione?
Stavo usando questa pagina per cercare di guidare me stesso attraverso il processo http://www.ats.ucla.edu/stat/stata/webbooks/reg/chapter2/statareg2.htm ma non so se è tutto ciò che devo controlla.