Interpretazione dell'output .L e .Q da un GLM binomiale negativo con dati categorici


14

Ho appena eseguito un GLM binomiale negativo e questo è l'output:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

I miei predittori sono tutti categorici. È per questo che sto ottenendo .Le .Q. Presumo che rappresentino le diverse categorie ma qualcuno conosce un codice che potrei usare per etichettarle prima di eseguire il GLM in modo che vengano visualizzate come categorie diverse?



Trovo che il codice sia abbastanza confuso c'è un codice più semplice? Le categorie sono molto semplici: metodo 1 e metodo 2, sito 1, sito2 e sito 3 e profondità è 5, 10 e 15
Vivienne,

Risposte:


13

Le tue variabili non sono solo codificate come fattori (per renderle categoriche), sono codificate come fattori ordinati . Quindi, per impostazione predefinita, R adatta una serie di funzioni polinomiali ai livelli della variabile. Il primo è lineare ( .L), il secondo è quadratico ( .Q), il terzo (se avessi abbastanza livelli) sarebbe cubico, ecc. R si adatterà ad una funzione polinomiale in meno rispetto al numero di livelli nella tua variabile. Ad esempio, se hai solo due livelli, sarebbe adatta solo la tendenza lineare. Inoltre, le basi polinomiali utilizzate sono ortogonali. (Per quello che vale, nulla di tutto ciò è specifico per R — o per i modelli binomiali negativi — tutti i software e i tipi di modelli di regressione farebbero lo stesso.)


Concentrandosi in particolare su R, se si voleva le variabili per essere codificati come ordinato o disordinato, si usa fattore? :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor

Oh, li avevo ordinati ora che ha le etichette, grazie mille!
Vivienne,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.