Comprensione dei parametri all'interno della distribuzione binomiale negativa


37

Stavo cercando di adattare i miei dati a vari modelli e ho capito che la fitdistrfunzione della libreria MASSdi Rmi dà Negative Binomialla soluzione migliore. Ora dalla pagina wiki , la definizione è data come:

La distribuzione NegBin (r, p) descrive la probabilità di k fallimenti e r successi nelle prove k + r Bernoulli (p) con successo nell'ultima prova.

L'uso Rper eseguire l'adattamento del modello mi dà due parametri meane dispersion parameter. Non capisco come interpretarli perché non riesco a vedere questi parametri sulla pagina wiki. Tutto quello che posso vedere è la seguente formula:

Formula di distribuzione binomiale negativa

dov'è kil numero di osservazioni e r=0...n. Ora, come posso metterli in relazione con i parametri indicati da R? Il file della guida non fornisce neanche molte informazioni.

Inoltre, solo per dire alcune parole sul mio esperimento: in un esperimento sociale che stavo conducendo, stavo cercando di contare il numero di persone che ogni utente ha contattato in un periodo di 10 giorni. La dimensione della popolazione era di 100 per l'esperimento.

Ora, se il modello si adatta al binomio negativo, posso dire ciecamente che segue quella distribuzione, ma voglio davvero capire il significato intuitivo dietro questo. Cosa significa dire che il numero di persone contattate dai miei soggetti di prova segue una distribuzione binomiale negativa? Qualcuno può aiutare a chiarire questo?

Risposte:



10

Come ho già detto nel mio precedente post, sto lavorando per sistemare una distribuzione per contare anche i dati. Ecco cosa ho imparato:

Quando la varianza è maggiore della media, la sovraispersione è evidente e quindi la distribuzione binomiale negativa è probabilmente appropriata. Se la varianza e la media sono uguali, viene suggerita la distribuzione di Poisson e quando la varianza è inferiore alla media, è consigliata la distribuzione binomiale.

Con i dati di conteggio su cui stai lavorando, stai usando la parametrizzazione "ecologica" della funzione binomiale negativa in R. La sezione 4.5.1.3 (Pagina 165) del seguente libro liberamente disponibile ne parla in modo specifico (nel contesto di R, niente di meno!) e, spero, potrei rispondere ad alcune delle tue domande:

http://www.math.mcmaster.ca/~bolker/emdbook/book.pdf

Se arrivate alla conclusione che i vostri dati sono troncati a zero (cioè, la probabilità di 0 osservazioni è 0), allora potreste voler dare un'occhiata al sapore a zero troncato del NBD che è nel pacchetto R VGAM .

Ecco un esempio della sua applicazione:

library(VGAM)

someCounts = data.frame(n = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16),
                     freq = c(182479,76986,44859,24315,16487,15308,5736,
                              2843,1370,1115,1127,49,100,490,106,2))

fit = vglm(n ~ 1, posnegbinomial, control = vglm.control(maxit = 1000), weights=freq,
           data=someCounts)

Coef(fit)

pdf2 = dposnegbin(x=with(someCounts, n), munb=0.8344248, size=0.4086801)

print( with(someCounts, cbind(n, freq, fitted=pdf2*sum(freq))), dig=9)

Spero che questo sia utile.


Pagina 165 del libro.
SmallChess,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.