Come usare anova per il confronto tra due modelli?


9

Come devo capire il anovarisultato quando si confrontano due modelli?

Esempio:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

La manpage afferma: "Calcola l'analisi delle tabelle di varianza (o devianza) per uno o più oggetti modello adattati". Tuttavia, il mio professore ha affermato che potrebbe essere impiegato per il confronto tra modelli - questo è quello che intendo fare.

Quindi presumo che potrei usare anova(model1, model2)e ottenere un valore p che mi dice se dovrei rifiutare l'ipotesi nulla: "i modelli sono gli stessi".

Posso affermare che se il valore p è inferiore a (diciamo) 0,05, i modelli differiscono in modo significativo?


Nel tuo esempio, il modello 1 e il modello 2 sono nidificati? Cioè, entrambi i modelli hanno un insieme condiviso di variabili predittive e la stessa variabile di risultato, ma un modello ha una o più variabili predittive aggiuntive?
EdM,

Uno è simile Y ~ X + X^2e il secondoY ~ X + X^2 + X^3
Petrbel,

Risposte:


13

Supponendo che i modelli siano nidificati (ovvero la stessa variabile di risultato e il modello 2 contenga tutte le variabili del modello 1 più 2 variabili aggiuntive), i risultati ANOVA dichiarano che le 2 variabili aggiuntive rappresentano congiuntamente una varianza sufficiente da poter rifiutare l'ipotesi nulla che il i coefficienti per entrambe le variabili sono pari a 0. Questo è effettivamente ciò che hai detto. Se entrambi i coefficienti equivalgono a 0, i modelli sono uguali.

Proprio come una nota aggiuntiva, nel caso in cui non fossi a conoscenza, ANOVA è sempre equivalente a fare confronti tra modelli. Quando si osserva ANOVA per un singolo modello, si ottengono gli effetti per ciascuna variabile predittore. Ciò equivale a fare un confronto tra il modello completo e un modello rimuovendo una delle variabili. cioè ti darà la somma dei quadrati (tipo III) e la statistica test per . Basta notare che R ti dà la somma dei quadrati di tipo I. Se è necessario il tipo III, utilizzare o utilizzare e continuare a modificare l'ordine delle variabili nel modello e prendere solo la somma dei quadrati per l'ultima variabile.Model1:y=a+bx1+cx2+dx3;Model2:y=a+bx1+cx2x3car::Anovaanova


Se ti ho capito bene, il valore di p inferiore a 0,05 dimostra che i modelli differiscono, stretto?
petrbel,

3
Non userei quelle parole (cioè "prova" e "modelli diversi"), ma intendiamo la stessa cosa. Direi che i tuoi dati non supportano l'ipotesi nulla che i coefficienti siano entrambi 0 o che i dati supportino l'ipotesi alternativa che i coefficienti non siano entrambi 0.
le_andrew

1
Prima di affermare che i modelli si sono dimostrati diversi o che l'ipotesi nulla non è supportata, assicurarsi che i dati soddisfino ragionevolmente i presupposti di ANOVA che sono alla base del calcolo e dell'interpretazione dei valori p.
EdM,

Per essere sicuri, l'ultima parte della somma dei quadrati di tipo I si applica solo alla situazione in cui anova()viene utilizzato su un modello?
Jasper,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.