Date tre variabili, y
e x
, che sono continue positive e z
, che è categorico, ho due modelli candidati dati da:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
e
fit.fe <- lm( y ~ 1 + x )
Spero di confrontare questi modelli per determinare quale modello è più appropriato. Mi sembra che in un certo senso fit.fe
sia annidato dentro fit.me
. In genere, quando si verifica questo scenario generale, è possibile eseguire un test chi-quadrato. In R
, possiamo eseguire questo test con il seguente comando,
anova(fit.fe,fit.me)
Quando entrambi i modelli contengono effetti casuali (generati lmer
dal lme4
pacchetto), il anova()
comando funziona correttamente. A causa dei parametri limite, è normalmente consigliabile testare la statistica Chi-Square risultante tramite simulazione, tuttavia, è ancora possibile utilizzare la statistica nella procedura di simulazione.
Quando entrambi i modelli contengono solo effetti fissi, questo approccio --- e il anova()
comando associato --- funzionano bene.
Tuttavia, quando un modello contiene effetti casuali e il modello ridotto contiene solo effetti fissi, come nello scenario sopra, il anova()
comando non funziona.
Più specificamente, ottengo il seguente errore:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
C'è qualcosa di sbagliato nell'usare l'approccio Chi-Square dall'alto (con la simulazione)? O è semplicemente un problema di anova()
non saper gestire i modelli lineari generati da diverse funzioni?
In altre parole, sarebbe opportuno generare manualmente la statistica Chi-Square derivata dai modelli? In tal caso, quali sono i gradi di libertà adeguati per confrontare questi modelli? Secondo i miei calcoli:
Stiamo stimando due parametri nel modello a effetti fissi (pendenza e intercetta) e altri due parametri (parametri di varianza per la pendenza casuale e intercettazione casuale) nel modello a effetti misti. In genere, il parametro intercetta non viene conteggiato nel calcolo dei gradi di libertà, quindi ciò implica che e ; detto che non sono sicuro se i parametri di varianza per i parametri degli effetti casuali debbano essere inclusi nel calcolo dei gradi di libertà; le stime di varianza per i parametri a effetto fisso non sono prese in considerazione , ma ritengo che ciò sia dovuto al fatto che le stime dei parametri per gli effetti fissi sono considerate costanti sconosciute mentre sono considerate variabili casuali inconoscibilip = k + 2 = 3per effetti misti. Gradirei un po 'di assistenza su questo problema.
Infine, qualcuno ha una soluzione più appropriata ( R
basata su) per confrontare questi modelli?
lm()
congls()
dalnlme
pacchetto elmer()
conlme()
(di nuovo dalnlme
pacchetto), tutto funzionerà correttamente. Si noti tuttavia che si otterrà un test conservativo ( valori p troppo grandi ), poiché i parametri per il modello più semplice si trovano al limite dello spazio parametri. E davvero la scelta se includere gli effetti casuali dovrebbe essere basata sulla teoria (ad esempio, il piano di campionamento), non su un test statistico.