Usando la regressione di Poisson per i dati continui?


11

La distribuzione di Poisson può essere utilizzata per analizzare dati continui e dati discreti?

Ho alcuni set di dati in cui le variabili di risposta sono continue, ma assomigliano a una distribuzione di Poisson piuttosto che a una distribuzione normale. Tuttavia, la distribuzione di Poisson è una distribuzione discreta e di solito si occupa di numeri o conteggi.


In che modo le tue distribuzioni empiriche differiscono quindi dai variati gamma?
whuber

1
Ho usato la distribuzione gamma per questi dati. Se si utilizza la distribuzione gamma con un collegamento di registro si ottiene quasi lo stesso esatto risultato che si ottiene da un modello di Poisson troppo disperso. Tuttavia, nella maggior parte dei pacchetti statistici che conosco la regressione di Poisson è più semplice e molto più flessibile.
user3136,

Non ci sarebbero altre distribuzioni migliori, ad esempio il suggerimento di gamma di whuber?
Peter Flom - Ripristina Monica

1
@PeterFlom - Mi chiedo se questo problema si presenti molto perché il pacchetto glmnet in R non supporta la famiglia Gamma o la famiglia gaussiana con una funzione di collegamento al log. Tuttavia, poiché glmnet viene utilizzato come pacchetto di modellazione predittiva (quindi gli utenti sono interessati solo ai coefficienti del modello, non agli errori di coeff. Stnd) e poiché il dbn Poisson produce un coeff coerente. stime per i modelli del modulo ln [E (y)] = beta0 + beta * X con risposte continue indipendentemente dalla distribuzione, immagino che gli autori di glmnet non si siano preoccupati di includere queste famiglie aggiuntive.
RobertF,

Risposte:


12

L'ipotesi chiave di un modello lineare generalizzato che è rilevante qui è la relazione tra la varianza e la media della risposta, dati i valori dei predittori. Quando specifichi una distribuzione di Poisson, ciò implica che stai assumendo che la varianza condizionale sia uguale alla media condizionale. * La forma effettiva della distribuzione non importa tanto: potrebbe essere Poisson, o gamma, o normale, o qualsiasi altra cosa purché rimanga quella relazione di varianza media.

* Puoi rilassare il presupposto che la varianza sia uguale alla media di una proporzionalità e di solito ottenga comunque buoni risultati.


9

Se stai parlando di usare una risposta di Poisson in un modello lineare generalizzato, allora sì, se sei disposto a fare l'ipotesi che la varianza di ogni osservazione sia uguale alla sua media.

Se non si desidera farlo, un'altra alternativa potrebbe essere quella di trasformare la risposta (ad esempio, prendere i registri).


Penso, oltre al tuo punto, anche se @ user3136 non è disposto a fare l'ipotesi di media = varianza, lui / lei può usare la quasipoissonfamiglia glm.
suncoolsu,

2
Ma il mio problema è perché vorresti trasformare i dati continui in discreti. Sta essenzialmente perdendo informazioni. Inoltre, quando una semplice logtrasformazione avrebbe funzionato, perché discretizzare i tuoi dati? Usando le glmopere, ma ogni risultato è basato sugli asintotici (che possono o meno essere
validi

@suncoolsu: 1) quasipoisson rende l'assunzione di media proporzionale alla varianza. 2) Non intendevo trasformare in discreto, intendevo trasformare (mantenendo la continuità) in modo da poter usare un modello diverso.
Simon Byrne,

Sì, ho capito di essere d'accordo con te. Scusa, stavo parlando della domanda. Quasi poisson, tiene conto del sovraispettore giusto? (se ricordo bene, cfr. Faraway 2006)
suncoolsu,

In questo caso particolare non ero soddisfatto del fatto che qualsiasi trasformazione che ho provato (log, sqrt, box-cox) abbia dato una buona approssimazione alla normalità. Per inciso, se uso il normale metodo di trasformazione del punteggio, posso trasformare la maggior parte dei dati in una normalità quasi meravigliosa, ma non ho visto questa trasformazione ampiamente utilizzata, quindi presumo che ci sia un problema (è difficile da trasformare indietro).
user3136,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.