Test di ipotesi di Poisson per due parametri


9

Quindi, per divertimento, sto prendendo alcuni dei dati delle chiamate dal call center in cui lavoro e sto provando a fare alcuni test di ipotesi su di essi, in particolare il numero di chiamate ricevute in una settimana, e usando una distribuzione Poisson per adattarla. A causa dell'argomento del mio lavoro, ci sono due tipi di settimane, chiamiamone uno su settimane in cui ipotizzo che ci siano più chiamate e fuori settimane in cui ipotizzo che ce ne siano meno.

Ho una teoria secondo cui il da settimane (chiamiamolo ) è più grande di quello da settimane fuori (chiamiamoloλλ1λ2 )

Quindi l'ipotesi che voglio testare è H0:λ1>λ2,H1:λ1λ2

So come testare un parametro (ad esempio ) ma non sono così sicuro su come procedere facendo 2 dato un set di dati. Supponiamo che prenda due settimane di dati da ciascuno e per la settimana off e e per la settimana. Qualcuno può aiutarmi a camminare attraverso questa versione più semplice in modo da poterlo applicare a un set di dati più grande? Ogni aiuto è apprezzato, grazie.H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6


3
Le chiamate sono davvero distribuite? Se ci sono molte chiamate, è preferibile modellarle come approssimativamente normali. Ma questo potrebbe uccidere il divertimento.
RegressForward

1
Bene, ciò che determina che è come lo inquadra nel modo giusto? Ricevo un numero x di chiamate discrete in un intervallo di tempo unitario. Potrei farlo come una normale distribuzione, certo, ma il punto è che mi piacerebbe provarlo con Poisson poiché si adatta.
James Snyder,

Se supponi che i conteggi siano Poisson, puoi semplicemente aggiungere i conteggi (correggimi se sbaglio). Cioè otterresti X = 2 + 3 e Y = 2 + 6. È quindi possibile verificare la differenza utilizzando, ad esempio, il "test.test" in R. Se si desidera provare un'analisi bayesiana, ho anche un post sul blog qui: sumsar.net/blog/2014/ 09 / bayesian-first-aid-poisson-test
Rasmus Bååth,

Risposte:


4

Si noti che normalmente l'uguaglianza va nel nulla (con una buona ragione).

A parte questo problema, citerò un paio di approcci per testare questo tipo di ipotesi

  1. Un test molto semplice: condizione sul conteggio totale osservato , che lo converte in un test binomiale di proporzioni. Immaginare che ci sono w on on-settimane e w off off-settimane e w settimane combinato.nwsuwviaw

Poi sotto l'ipotesi nulla, le proporzioni sono attesi ewoffwsuw rispettivamente. Puoi eseguire un test con una coda della proporzione nelle settimane settimanali abbastanza facilmente.wviaw

  1. È possibile costruire un test a una coda adattando una statistica correlata a un test del rapporto di verosimiglianza; la forma z del Wald-test o un test del punteggio può essere eseguita ad esempio con una coda e dovrebbe funzionare bene per il grandi dimensioni .λ

Ci sono altre interpretazioni.


1

Che ne dici di usare appena il GLM con struttura degli errori di Poisson e log-link ??? Ma l'idea del binomio potrebbe essere più potente.


Al momento, questo è più un commento che una risposta. Lo intendevi come un commento, una domanda di chiarimento o una risposta? Se quest'ultimo, puoi espanderlo in più di risposta? Possiamo anche convertirlo in un commento per te.
gung - Ripristina Monica

1

Lo sistemerei con un GLM Poisson o Quasi-Poisson con una preferenza per quasi-Poisson o binomio negativo.

Il problema con l'uso di Poisson tradizionale è che richiede che la varianza e la media siano uguali, cosa che molto probabilmente non è il caso. Il quasi-Poisson o NB stima la varianza senza restrizioni dalla media.

Puoi fare uno di questi in R molto facilmente.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

L'approccio GLM è vantaggioso e poiché è possibile espandersi per includere variabili aggiuntive (ad esempio, il mese dell'anno) che potrebbero influire sul volume delle chiamate.

Per farlo a mano, probabilmente userei un'approssimazione normale e un test t con due campioni.


1

Iniziamo con il parametro Stima massima verosimiglianza per Poisson, che è media.

λ^1=Y¯  un'nd  λ^2=X¯

Y¯-X¯~N(λ1-λ2,λ1n1+λ2n2)

(Y¯-X¯)-λ1-λ2λ1n1+λ2n2

Z<Criotiocun'l Vun'lue


0

A partire da pagina 125 dell'ipotesi statistica dei test di Casella, viene delineata la risposta al tipo di domanda formulata. Ho allegato un link a un pdf che ho trovato online per riferimento. Ipotesi statistica sui test di Casella, terza edizione .


Bel puntatore, tuttavia le risposte solo link sono scoraggiate su Cross Validated. Potresti disegnare la risoluzione nella tua risposta? Grazie.
Xi'an,

Mi dispiace non ero a conoscenza di questa regola. Grazie per avermelo fatto notare. :) Cercherò di dare una risposta esaustiva al più presto.
Nuzhi Meyen,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.