Che cos'è il theta in una regressione binomiale negativa dotata di R?


26

Ho una domanda su una regressione binomiale negativa: supponi di avere i seguenti comandi:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Nota che le auto sono un set di dati disponibile in R, e non mi interessa davvero se questo modello ha senso.)

Quello che vorrei sapere è: come posso interpretare la variabile theta(come restituita in fondo a una chiamata a summary). È questo il parametro di forma della distribuzione di negbin ed è possibile interpretarlo come una misura dell'asimmetria?


Un riassunto di ciò che dice MASS è qui .
Scortchi - Ripristina Monica

Risposte:


17

Sì, thetaè il parametro di forma della distribuzione binomiale negativa e no, non puoi davvero interpretarlo come una misura dell'asimmetria. Più precisamente:

  • l'asimmetria dipenderà dal valore di theta, ma anche dalla media
  • non ha valore thetache ti garantirà la mancanza di inclinazione

Se non l'ho incasinato, nella mu/ thetaparametrizzazione utilizzata nella regressione binomiale negativa, l'asimmetria è

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

In questo contesto, viene generalmente interpretato come una misura di sovradispersione rispetto alla distribuzione di Poisson. La varianza del binomio negativo è μ + μ 2 / θ , quindi θ controlla davvero la variabilità in eccesso rispetto a Poisson (che sarebbe μ ), e non l'inclinazione.θμ+μ2/θθμ


grazie finora! Questo è un buon aiuto ... Ma: come posso interpretare valori alti o (bassi) di theta? Nel libro McCaullaughs modelli lineari generalizzati c'è un collegamento a questo articolo di Anscombe per fare un'interpretazione di k. Ma sfortunatamente non capisco. L'articolo è claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar

Devi solo leggere la prima pagina. Quindi theta (o k in anscombe) è il parametro di forma della distribuzione negbin e riesce, se la distribuzione è più vicina alla gamma (k -> 0) o al poisson (k -> infinito). Ma cosa significa adattarsi? Come posso interpretare theta per esempio per la stima delle auto?
MarkDollar,

33

Mi è stato riferito a questo sito da uno dei miei studenti nel mio corso Modeling Count Data . Sembra esserci molta disinformazione sul modello binomiale negativo, e in particolare per quanto riguarda la statistica di dispersione e il parametro di dispersione.

La statistica di dispersione, che fornisce un'indicazione di extra dispersione del modello di conteggio, è la statistica di Pearson divisa per il DOF residuo. è il parametro location o shape. Per i modelli di conteggio, il parametro di scala è impostato su 1. R e θ è un parametro di dispersione o parametro ausiliario. L'ho chiamato il parametro di eterogeneità nella prima edizione del mio libro, Negative Binomial Regression (2007, Cambridge University Press), ma lo ho chiamato parametro di dispersione nella mia seconda edizione del 2011. Fornisco una logica completa per i vari termini del modello NB nel mio prossimo libro, Modeling Count Data (Cambridge) che verrà pubblicato oggi. Dovrebbe essere in vendita (tascabile) entro il 15 luglio. μglmglm.nb θ

glm.nbe glmsono insoliti nel modo in cui definiscono il parametro di dispersione. La varianza è espressa in anzichéμ+αμ2, che è la parametrizzazione diretta. È il modo in cui NB è modellato in SAS, Stata, Limdep, SPSS, Matlab, Genstat, Xplore e quasi tutti i software. Quando si confrontano irisultati con altri risultati del software, ricordare questo. L'autore di(che proveniva da S-plus) eμ+μ2θμ+αμ2glm.nbglmglm.nbapparentemente prese la relazione indiretta da McCullagh & Nelder, ma Nelder (che era il co-fondatore di GLM nel 1972) scrisse il suo componente aggiuntivo di sistema kk a Genstat nel 1993 in cui sosteneva che la relazione diretta fosse preferita. Lui e sua moglie erano soliti visitare me e la mia famiglia ogni due anni in Arizona a partire dall'inizio del 1993 fino all'anno prima della sua morte. Ne abbiamo discusso abbastanza approfonditamente, dal momento che avevo messo una relazione diretta con il programma glm che ho scritto alla fine del 1992 per il software Stata e Xplore e per una macro SAS nel 1994.

nbinomialαθnbinomial


2
φcov(β^)=φ(XTŴ^X)-1, che sembra chiamare scale. Così tante persone scelgono di chiamare ilθin modo diverso. Derivato anche dalla funzione R, tendevo a chiamareμ posizione e θ"forma", quest'ultima delle quali non trovo irragionevole in quanto influenza sicuramente la forma.
Momo,

Qual è la gamma di theta? Il theta deve avere un valore maggiore di uno?
News_is_Selection_Bias il

2

binomio negativo glm di riferimento: enter image description here

Il binomio negativo di Wikipedia 'r' è 'theta' di glm che implica che glm 'theta' è un parametro di forma. In termini semplici, il 'theta' di glm è il numero di fallimenti.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.