Vorrei fare un test W di Shapiro Wilk e un test Kolmogorov-Smirnov sui residui di un modello lineare per verificare la normalità. Mi stavo solo chiedendo quali residui dovrebbero essere usati per questo - i residui grezzi, i residui di Pearson, i residui studentizzati o i residui standardizzati? Per un test W di Shapiro-Wilk sembra che i risultati per i residui grezzi e di Pearson siano identici ma non per gli altri.
fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143
Stessa domanda per KS, e anche se i residui devono essere testati contro una distribuzione normale (pnorm) come in
ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563
o una distribuzione t-student con nk-2 gradi di libertà, come in
ks.test(res3, "pt",df=nrow(mtcars)-2-2)
Qualche consiglio forse? Inoltre, quali sono i valori raccomandati per le statistiche di test W (> 0.9?) E D in modo che la distribuzione sia sufficientemente vicina alla normalità e non influisca troppo sull'inferenza?
Infine, questo approccio tiene conto dell'incertezza nei coefficienti di lm adattati o funzionerebbe meglio nel cumres()
pacchetto gof()
in questo senso?
saluti, Tom