Confronto tra due modelli usando la funzione anova () in R

Dalla documentazione per anova():

Quando viene data una sequenza di oggetti, 'anova' verifica i modelli l'uno contro l'altro nell'ordine specificato ...

Cosa significa testare i modelli l'uno contro l'altro? E perché l'ordine conta?

Ecco un esempio dal tutorial di GenABEL :

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Come interpreto questo output?

r anova

— QED
fonte

Quando lo usi anova(lm.1,lm.2,test="Chisq"), esegue il test Chi-quadro per confrontare lm.1e lm.2(cioè verifica se la riduzione della somma residua dei quadrati è statisticamente significativa o meno). Nota che questo ha senso solo se lm.1e lm.2sono modelli nidificati.

$\alpha=0.05$ $\alpha=0.1$

Scopri ANOVA anche per i modelli lineari .

— statistica
fonte

Ma questo implica qualcosa sul fatto che uno dei due sia migliore? Grazie!

— Qed

Dipende da come si definisce il termine "migliore". Se lo definisci come il modello che fornisce meno somma residua di quadrati, la risposta è sì. Questo perché, questo test confronta la riduzione della somma residua dei quadrati.

— Stat

D'altra parte, se i due modelli non sono significativamente diversi, si potrebbe sostenere che il modello più semplice è "migliore"? Sto pensando al parcimonio qui.

— Sininho,

e se l'anova (mod1, mod2, test = "LRT") che differenza fa questo?

— ElleryL,