Pearson VS Deviance Residuals nella regressione logistica


16

So che i residui Pearson standardizzati sono ottenuti in modo probabilistico tradizionale:

ri=yiπiπi(1πi)

e Deviance Residuals sono ottenuti attraverso un modo più statistico (il contributo di ciascun punto alla probabilità):

di=si2[yilogπi^+(1yi)log(1πi)]

dove = 1 se = 1 e = -1 se = 0.y i s i y isiyisiyi

Puoi spiegarmi, intuitivamente, come interpretare la formula per i residui di devianza?

Inoltre, se voglio sceglierne uno, quale è più adatto e perché?

A proposito, alcuni riferimenti sostengono che deriviamo i residui di devianza in base al termine

12ri2

dove è menzionato sopra.ri


Ogni pensiero sarebbe apprezzato
Jack Shi l'

1
Quando dici "alcuni riferimenti" ... quali riferimenti e come lo fanno?
Glen_b -Restate Monica

Risposte:


10

La regressione logistica cerca di massimizzare la funzione di probabilità logaritmica

LL=kln(Pi)+rln(1Pi)

dove è la probabilità prevista che il caso i sia ; è il numero di casi osservati come e è il numero di (il resto) casi osservati come .PiY^=1kY=1rY=0

Quell'espressione è uguale a

LL=(kdi2+rdi2)/2

perché il residuo di devianza di un caso è definito come:

di={2ln(Pi)if Yi=12ln(1Pi)if Yi=0

Pertanto, la regressione logistica binaria cerca direttamente di minimizzare la somma dei residui di devianza al quadrato. Sono i residui di devianza che sono implicati nell'algoritmo ML della regressione.

La statistica Chi-sq del modello è , dove il modello completo contiene predittori e il modello ridotto no.2(LLfull modelLLreduced model)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.