Regressione di Poisson a gonfiaggio zero


14

Supponiamo che siano indipendenti eY=(Y1,,Yn)

Yi=0with probability pi+(1pi)eλiYi=kwith probability (1pi)eλiλik/k!

Supponiamo anche che i parametri e p = ( p 1 , , p n ) soddisfinoλ=(λ1,,λn)p=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gλ.

Se le stesse covariate influenzano e p in modo che B = G , allora perché la regressione di Poisson gonfiata a zero richiede il doppio dei parametri della regressione di Poisson?λpB=G


2
Devi ancora stimare e λ . B e G sono matrici di progettazione (dati), quindi quelli uguali non riducono la dimensione dello spazio dei parametri. βλBG
Macro,

@Macro: se è una colonna di quelli, allora perché dovremmo aver bisogno di 1 parametro in più per stimare la regressione di Poisson? G
Damien,

bene avresti bisogno di stimare (l '"intercetta" nella parte logistica del modello) e λ i (l' "intercetta" nella parte di Poisson del modello) quindi ci sono 2 parametri invece di 1.piλi
Macro

1
@Robby, per ridurre il numero di parametri che dovresti fare alcuni vincoli. Ad esempio, , sebbene non vi sia motivo di pensare che ciò abbia un senso, soprattutto perché le funzioni di collegamento sono diverse. λ=β
Macro,

3
@MichaelChernick - si chiama Poisson a zero inflazione perché in pratica stai "gonfiando" la probabilità di vedere uno zero da una distanza di Poisson mantenendo le stesse probabilità relative di vedere un valore diverso da quello di Poisson.
jbowman,

Risposte:


2

Nel caso di Poisson zero gonfiato, se , allora β e λ entrambi hanno la stessa lunghezza, che è il numero di colonne di B o G . Quindi il numero di parametri è il doppio del numero di colonne della matrice di progettazione, cioè il doppio del numero di variabili esplicative incluso l'intercettazione (e qualunque codifica fittizia fosse necessaria).B=GβλBG

In una regressione diretta di Poisson, non vi è alcun vettore di cui preoccuparsi, non è necessario stimare λ . Quindi il numero di parametri è solo la lunghezza di β, cioè la metà del numero di parametri nel caso zero-inflated.pλβ

Ora, non c'è un motivo particolare per cui debba eguagliare G , ma generalmente ha senso. Tuttavia, si potrebbe immaginare un processo di generazione di dati in cui la possibilità di avere qualsiasi evento è creata da un processo G λ e un processo B β completamente diverso guida quanti eventi ci sono, dati eventi diversi da zero. Come esempio inventato, scelgo le aule in base ai punteggi degli esami di storia per giocare una partita non correlata, quindi osservo il numero di goal segnati. In questo caso B potrebbe essere abbastanza diverso da G (se le cose che guidano i punteggi degli esami di storia sono diverse da quelle delle prestazioni di guida nel gioco) e β e λBGGλBβBGβλpotrebbe avere lunghezze diverse. potrebbe avere più colonne di B o meno. Quindi il modello Poisson a gonfiaggio zero in quel caso avrà più parametri di un semplice modello Poisson.GB

Nella pratica comune penso che più delle volte.G=B

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.