Sto riflettendo sulla discussione intorno a questa domanda e in particolare sul commento di Frank Harrell secondo cui la stima della varianza in un modello ridotto (cioè uno da cui sono state testate e respinte una serie di variabili esplicative) dovrebbe usare i gradi di libertà generalizzati di Ye . Il professor Harrell sottolinea che questo sarà molto più vicino ai gradi residui di libertà del modello "pieno" originale (con tutte le variabili in) rispetto a quello di un modello finale (da cui un certo numero di variabili sono state respinte).
Domanda 1. Se voglio usare un approccio appropriato a tutti i riassunti e le statistiche standard da un modello ridotto (ma a corto di una piena attuazione dei gradi generalizzati di libertà), un approccio ragionevole sarebbe quello di usare solo i gradi residui di libertà da il modello completo nelle mie stime di varianza residua, ecc.?
Domanda 2. Se quanto sopra è vero e voglio farlo R
, potrebbe essere semplice come l'impostazione
finalModel$df.residual <- fullModel$df.residual
a un certo punto dell'esercizio di adattamento del modello, in cui finalModel e fullModel sono stati creati con lm () o una funzione simile. Dopo di che funzioni come summary () e confint () sembrano funzionare con il desiderato df.residual, anche se restituendo un messaggio di errore che qualcuno ha chiaramente confuso con l'oggetto finalModel.
lmer
nell'output. Vedi il suo ragionamento qui .