Risposte:
Lascia LL = loglikelihood
Ecco un breve riepilogo di ciò che vedi dall'output del riepilogo (glm.fit),
Deviazione nulla = 2 (LL (modello saturo) - LL (modello null)) su df = df_Sat - df_Null
Devianza residua = 2 (LL (modello saturo) - LL (modello proposto)) df = df_Sat - df_Proposed
Il modello saturo è un modello che presuppone che ogni punto dati abbia i propri parametri (il che significa che hai n parametri da stimare).
Il Modello null assume l'esatto "opposto", in quanto assume un parametro per tutti i punti dati, il che significa che si stima solo 1 parametro.
Il Modello proposto presuppone che tu possa spiegare i tuoi punti dati con parametri p + un termine di intercettazione, quindi hai p + 1 parametri.
Se Null Deviance è davvero piccolo, significa che il modello Null spiega abbastanza bene i dati. Allo stesso modo con la tua devianza residua .
Cosa significa veramente piccolo? Se il tuo modello è "buono", la tua Devianza è circa Chi ^ 2 con (df_sat - df_model) gradi di libertà.
Se vuoi confrontare il tuo modello Null con il tuo modello Proposto, allora puoi guardare
(Deviazione nulla - Devianza residua) circa Chi ^ 2 con df Proposto - df Null = (n- (p + 1)) - (n-1) = p
I risultati che hai dato direttamente da R? Sembrano un po 'strani, perché generalmente dovresti vedere che i gradi di libertà riportati sul Null sono sempre più alti dei gradi di libertà riportati sul Residuo. Questo perché di nuovo, Null Deviance df = Saturated df - Null df = n-1 Residual Deviance df = Saturated df - Proposto df = n- (p + 1)
La deviazione nulla mostra quanto bene la risposta sia prevista dal modello con nient'altro che un'intercettazione.
La deviazione residua mostra quanto bene la risposta è prevista dal modello quando i predittori sono inclusi. Dal tuo esempio, si può vedere che la devianza aumenta di 3443,3 quando vengono aggiunte 22 variabili predittive (nota: gradi di libertà = numero di osservazioni - numero di predittori). Questo aumento della devianza è la prova di una significativa mancanza di adattamento.
Possiamo anche usare la devianza residua per verificare se l'ipotesi nulla è vera (cioè il modello di regressione logistica fornisce una misura adeguata per i dati). Ciò è possibile perché la devianza è data dal valore chi-quadrato ad un certo grado di libertà. Per verificare la significatività, possiamo scoprire i valori p associati usando la formula seguente in R:
p-value = 1 - pchisq(deviance, degrees of freedom)
Usando i valori di deviazione residua e DF sopra indicati, si ottiene un valore p di circa zero, a dimostrazione che esiste una significativa mancanza di prove a supporto dell'ipotesi nulla.
> 1 - pchisq(4589.4, 1099)
[1] 0
GLM
?