Confronto dei modelli di regressione sui dati di conteggio


11

Di recente ho adattato 4 modelli di regressione multipla per gli stessi dati predittore / risposta. Due dei modelli che combatto con la regressione di Poisson.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

Due dei modelli che combatto con la regressione binomiale negativa.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

Esiste un test statistico che posso usare per confrontare questi modelli? Ho usato l'AIC come misura dell'adattamento, ma AFAIK non rappresenta un vero test.


Vuoi confrontare l' adattamento dei modelli usando un test statistico, giusto? Che tipo di ipotesi ti piacerebbe testare?
Firefeather,

@Firefeather Ad esempio, vorrei testare se l'adattamento di model.nb.interè significativamente migliore di quello di model.pois.inter. Sì, l'AIC è inferiore, ma quanto inferiore costituisce significativamente meglio ?
Daniel Standage,

Nota: la risposta a questa domanda non deve in realtà includere l'AIC.
Daniel Standage,

Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF

1
@Firefeather, sì, sono consapevole della necessità di controllare il livello di confidenza familiare. Scheffe sarebbe più appropriato qui di, per esempio, Bonferroni?
Daniel Standage,

Risposte:


14

È possibile confrontare il modello binomiale negativo con il modello di Poisson corrispondente con un test del rapporto di verosimiglianza. Un modello di Poisson è equivalente a un modello binomiale negativo con un parametro di sovradispersione pari a zero. Pertanto sono modelli nidificati e sono validi i rapporti di probabilità. La complicazione è che il parametro di overdispersion è limitato a non negativo, cioè logicamente non può essere inferiore a zero, quindi l'ipotesi nulla si trova al limite dello spazio dei parametri. Ciò significa che invece di confrontare il doppio della probabilità logaritmica con una distribuzione chi-quadro con un grado di libertà, è necessario confrontarlo con una distribuzione della miscela costituita da parti uguali di un chi-quadrato con 1 df e una massa in punti pari a zero (una distribuzione chi-quadrata con zero gradi di libertà). Ciò significa in pratica che è possibile calcolare il valore p usando il chi-quadrato con 1 df e quindi dimezzarlo. Per ulteriori dettagli e informazioni, vedere il caso 5 diSelf & Liang JASA 1987; 82 : 605-610. .

Si noti che alcuni pacchetti software statistici, come Stata, faranno tutto questo automaticamente quando si inserisce un modello binomiale negativo. In effetti ho spudoratamente paralizzato gran parte di quanto sopra dal sistema di aiuto di Stata - se hai Stata a vedere help j_chibar.


5

Credo che anova()R possa essere usato per questo. Nonostante il suo nome, è un test del rapporto di verosimiglianza. Crawley nel suo The R Book ha alcuni esempi di utilizzo.


1

Come note di onestop, poiché i modelli sono nidificati è possibile eseguire un test del rapporto di verosimiglianza.

In generale, tuttavia, non è vero, quindi se si desidera confrontare modelli non nidificati è possibile utilizzare il test di Vuong .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.