Testare il modello GLM utilizzando le deviazioni null e del modello


11

Ho costruito un modello glm in R e l'ho testato utilizzando un gruppo di test e formazione, quindi sono sicuro che funzioni bene. I risultati di R sono:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Tutti i valori di p per i coefficienti sono piccoli come previsto.

Guardando questa domanda ( interpretazione della devianza residua e nulla nella GLM R ), dovrei essere in grado di calcolare se l'ipotesi nulla è valida usando la seguente equazione:

p-value = 1 - pchisq(deviance, degrees of freedom)

Attaccando questo si ottiene:

1 - pchisq(256600, 671266)
[1] 1

Quindi ho ragione nel pensare che l'ipotesi nulla non possa essere respinta qui, anche se i valori di p per tutti i coefficienti sono così piccoli o ho frainteso come calcolarlo?

Risposte:


18

C'è un malinteso qui. La differenza tra la deviazione nulla e la devianza del modello è distribuita come un chi-quadrato con gradi di libertà pari al null df meno il df del modello. Per il tuo modello, sarebbe:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1


2
Quale ipotesi stai testando esattamente con l'affermazione 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII,

5
@jesterII, stai verificando se la devianza è cambiata più del previsto per caso. Vale a dire, stai testando se il modello nel suo insieme è migliore del modello nullo. È analogo al test F globale in un modello lineare.
gung - Ripristina Monica

L'ipotesi nulla è "il modello nel suo insieme è migliore del modello null" e hai respinto l'ipotesi nulla, il che significa che il modello è scarso?
jII,

3
@jesterII, no l'ipotesi nulla è: "il modello nel suo insieme non è migliore del modello null". Poiché questo è stato respinto, concludiamo che i dati non sono coerenti con il modello null. NB, ciò non significa necessariamente che il nostro modello sia "buono" o "corretto".
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.