È necessario regolare i conteggi zero per un test del rapporto di verosimiglianza dei modelli poisson / loglineari?


9

Se ci sono 0 nella tabella di contingenza e stiamo adattando modelli di poisson / loglineare annidati (usando la glmfunzione R ) per un test del rapporto di verosimiglianza, dobbiamo regolare i dati prima di adattare i modelli glm (ad esempio aggiungere 1/2 a tutti i conteggi)? Ovviamente alcuni parametri non possono essere stimati senza qualche aggiustamento, ma in che modo l'adattamento / mancanza di aggiustamento influisce sul test LR?


presumibilmente la glmroutine andrebbe in tilt se non fosse in grado di gestire gli zeri. l'hai provato?
Shabbychef,

1
sì, non si arresta in modo anomalo, ma a seconda della formula (ad esempio in un modello saturo), alcuni dei parametri possono avere effettivamente errori standard infiniti. La mia domanda è se questo è un problema quando si esegue un test del rapporto di verosimiglianza. È ancora possibile calcolare una probabilità anche se alcuni parametri non sono stimati, tali parametri non contribuiranno alla probabilità. Qual è la pratica standard e perché?
BR1,

Risposte:


7

Uno dei poteri della modellazione di regressione in generale è che è possibile smussare aree prive di dati, sebbene, come notato, a volte ci sono problemi nella stima dei parametri. Suggerirei che se stai ricevendo cose come infiniti errori standard è tempo di riconsiderare il tuo approccio alla modellazione un po '.

Una nota particolare di cautela: c'è una differenza tra "Non avere conteggi" in uno strato particolare, ed è impossibile che ci siano conteggi in quegli strati. Ad esempio, immagina di lavorare su uno studio dei disturbi psicologici per la Marina degli Stati Uniti tra il 2000 e il 2009 e di avere termini di regressione binaria sia per "Is a Woman" che per "Serve on a Submarine". Un modello di regressione può essere in grado di stimare gli effetti in cui entrambe le variabili = 1 pur avendo un conteggio zero in cui entrambi = 1. Tuttavia tale inferenza non sarebbe valida - tale circostanza è impossibile. Questo problema si chiama "non positività" ed è occasionalmente un problema in modelli altamente stratificati.


@ skyguy94 Stranamente non lo so - lo sapevo, mi ero appena dimenticato di notare l'uso di un set di dati retrospettivo>. <. Modificato per riflettere questo.
Fomite,

Ri: "Un modello di regressione potrebbe essere in grado di stimare gli effetti in cui entrambe le variabili = 1 o le interazioni tra i due " - Non penso sia vero. Se hai due predittori binari che non sono mai "1" insieme, l'interazione è costante (è sempre "0"), quindi il suo effetto non viene identificato.
Macro

@Macro Hai ragione, sto modificando leggermente. Stavo pensando a termini in cui non sono indicatori binari.
Fomite

1
(+1) Quindi, problemi con la non plausibilità del caso in cui entrambi = 1 a parte, la stima basata sul modello sarebbe solo la somma dei due effetti marginali, che sappiamo essere molto fuorviante a sé stante :)
Macro
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.