L'interpretazione della media del modello risulta in R


11

Sto cercando di capire e sapere cosa riportare dalla mia analisi di alcuni dati usando la media del modello in R.

Sto usando il seguente script per analizzare l'effetto del metodo di misurazione su una determinata variabile: Ecco il set di dati: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Modello da montare:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

dragare modello completo

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Ottieni informazioni di riepilogo di tutti i modelli per ottenere stime dei parametri

summary(model.avg(d))

So che entrambi i modelli possono essere mediati (media del modello completo) o solo un sottoinsieme di essi (media condizionale). Ora, vorrei sapere: quando è meglio usare la media piena o condizionale per fare inferenze. Cosa dovrei riferire di tutto ciò per un articolo scientifico? Cosa significa esattamente il valore Z e la p associata per una situazione media del modello?

Per semplificare la visualizzazione delle mie domande. Ecco la tabella dei risultati,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

Risposte:


5

Vedi Grueber et al. 2011, "Inferenza multimodello in ecologia ed evoluzione: sfide e soluzioni" Evolutionary Biology 24: 699-711.

Dipende molto dagli obiettivi se si desidera utilizzare dati completi o condizionali. Nel mio campo utilizzeremmo criteri, come AICC, per determinare quali modelli sono maggiormente supportati, quindi utilizzarli come sottoinsieme condizionale. Queste informazioni sarebbero quindi riportate. Ad esempio, i tuoi primi quattro modelli sono tutti all'interno di 2 unità AIC l'una dall'altra, quindi sarebbero tutti inclusi nel tuo sottoinsieme. Gli altri sono molto disponibili (AIC più elevato), quindi includere informazioni da essi ridurrebbe effettivamente la qualità delle stime beta.


2
Anche nel tuo esempio suggerito, ci saranno alcuni termini che appariranno in forse due dei quattro "migliori" modelli. Prendi una media di quei due valori di coefficiente o dei due valori e due valori zero per i due modelli in cui non compaiono?
user2390246,

5

Penso che la premessa sulla differenza tra ciò che sono esattamente le medie complete e condizionali sia sbagliata. Uno è una media che include zero (completo) e uno non include zero (condizionale). dal file della guida per il comando model.avg ():

Nota

La media di "sottoinsieme" (o "condizionale") è in media solo sui modelli in cui appare il parametro. In alternativa, la media "piena" presuppone che una variabile sia inclusa in ogni modello, ma in alcuni modelli il coefficiente corrispondente (e la sua varianza corrispondente) è impostato su zero. A differenza della "media del sottoinsieme", non ha la tendenza a differenziare il valore da zero. La media "completa" è un tipo di stimatore di contrazione e per le variabili con una relazione debole con la risposta sono più piccoli degli stimatori di "sottoinsieme".

Se si desidera utilizzare solo un sottoinsieme di modelli (ad esempio basato su delta AIC), utilizzare l'argomento del sottoinsieme in model.avg (). Otterrai comunque stime complete e condizionali, a condizione che ad alcuni dei modelli inclusi manchino alcune variabili che altri hanno.


Sì. Sono d'accordo. Questa è l'interpretazione corretta.
ecologo1234,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.