Dai miei risultati, sembra che GLM Gamma soddisfi la maggior parte delle ipotesi, ma è un miglioramento utile rispetto alla LM trasformata in tronchi? La maggior parte della letteratura che ho trovato accordi con Poisson o Binomial GLMs. Ho trovato l'articolo VALUTAZIONE DELLE ASSUNZIONI DEL MODELLO LINEARE GENERALIZZATO MEDIANTE LA RANDOMIZZAZIONE molto utile, ma manca delle trame reali utilizzate per prendere una decisione. Spero che qualcuno con esperienza possa indicarmi la giusta direzione.
Voglio modellare la distribuzione della mia variabile di risposta T, la cui distribuzione è tracciata di seguito. Come si può vedere, si tratta di asimmetria positiva:
.
Ho due fattori categorici da considerare: METH e CASEPART.
Si noti che questo studio è principalmente esplorativo, che serve essenzialmente come studio pilota prima di teorizzare un modello ed eseguire il DoE attorno ad esso.
Ho i seguenti modelli in R, con i loro grafici diagnostici:
LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)
GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))
GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))
Ho anche raggiunto i seguenti valori P tramite i test di Shapiro-Wilks sui residui:
LM.LOG: 2.347e-11
GLM.GAMMA: 0.6288
GLM.GAUS: 0.6288
Ho calcolato i valori AIC e BIC, ma se ho ragione, non mi dicono molto a causa delle diverse famiglie nei GLM / LM.
Inoltre, ho notato i valori estremi, ma non posso classificarli come valori anomali in quanto non esiste una chiara "causa speciale".