Problema nel confrontare i modelli GLM con una diversa funzione di collegamento


12

Dato lo stesso insieme di covariate e famiglie di distribuzione, come posso confrontare modelli con funzioni di collegamento diverse?

Penso che la risposta corretta qui sia "AIC / BIC", ma non sono sicuro al 100%.

È possibile avere modelli nidificati se hanno un collegamento diverso?


Si noti che "AIC / BIC" è una delle possibili risposte ma, in linea di principio, è possibile utilizzare qualsiasi tecnica (appropriata) di selezione dei modelli.

2
No, non sono nidificati. Inoltre, ricorda che quando si utilizza AIC / BIC, anche le costanti di normalizzazione contano .

5
Criteri informativi, come AIC e BIC, regolano semplicemente la devianza del modello per la sua complessità (cioè il numero di parametri). Se hai lo stesso numero di covariate (nemmeno necessariamente le stesse covariate), tale aggiustamento sarà irrilevante. Puoi verificarli confrontando direttamente le deviazioni. Potresti trovare utile leggere la mia risposta qui: differenza-tra-logit-e-probit-modelli , che tocca questo problema.
gung - Ripristina Monica

3
Un'altra possibilità per confrontare i modelli, che è molto generale, ma richiede di più da te, è quella di utilizzare il metodo parametrico Bootstrap Cross-Fitting. Puoi trovare un pdf qui .
gung - Ripristina Monica

2
C'è una famiglia particolare che hai in mente con 2 possibili funzioni di collegamento? cioè famiglia binomiale, logit vs log link?
Placidia,

Risposte:


9

Per questo problema puoi anche usare i cosiddetti "test di bontà dei link", il cui trattamento canonico è stato pubblicato da Daryl Pregibon in Applied Statistics nel 1980. Puoi leggere l' articolo qui.

Ci sono stati anche alcuni lavori più recenti su questo fronte, evidentemente da Cheng e Wu nel loro documento JASA del 1994 .

Come affermato da @gung è anche possibile usare la devianza, vedi ad esempio questo documento se non vuoi prenderlo al valore nominale.


3
+1, è bello avere la carta canonica. A proposito, ho il sospetto che intendevi un lavoro recente , non un lavoro di "ragione".
gung - Ripristina Monica

6

(Sto solo copiando le informazioni dai commenti qui in modo che questa domanda non si presenti come ufficialmente senza risposta.)

È possibile confrontare i due modelli confrontando le deviazioni. Tutto ciò che fanno AIC e BIC è regolare le deviazioni per il numero di parametri nel modello. Poiché quel numero è lo stesso, non farà alcuna differenza. In generale, sarà molto difficile distinguere tra diverse funzioni di collegamento a meno che non differiscano nella forma; spesso è meglio usare le conoscenze teoriche per determinare la funzione di collegamento appropriata. Ad esempio, i collegamenti logit e probit differiscono a malapena nella forma, ma differiscono nel modo in cui stai pensando al processo di generazione dei dati (come discuterò qui ).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.