Abbiamo un processo casuale che può-o-può-non si verificano più volte in un determinato periodo di tempo . Abbiamo un feed di dati da un modello preesistente di questo processo, che fornisce la probabilità che si verifichino numerosi eventi nel periodo . Questo modello esistente è vecchio e dobbiamo eseguire verifiche in tempo reale sui dati dei feed per errori di stima. Il vecchio modello che produce il feed di dati (che fornisce la probabilità che si verifichino n eventi nel tempo rimanente ) è distribuito approssimativamente in Poisson.
Quindi, per verificare anomalie / errori, lasciamo il tempo rimanente e il numero totale di eventi che si verificano nel tempo rimanente . Il vecchio modello implica le stime . Quindi sotto il nostro presupposto abbiamo:
Questo approccio funziona in modo fantastico nel rilevare errori nel conteggio degli eventi stimati per l'intero periodo , ma non così bene se vogliamo fare lo stesso per un altro periodo dove . Per ovviare a questo, abbiamo deciso che ora vogliamo passare a utilizzare la distribuzione binomiale negativa in modo da assumere ora e abbiamo:
1. Possiamo semplicemente impostare nella distribuzione binomiale negativa? In caso contrario, perché no?
2. Supponendo che possiamo impostare dove è una funzione, come possiamo impostare correttamente (dobbiamo adattare usando i set di dati passati)?
3. Is dipende dal numero di eventi che ci aspettiamo che si verifichi nel corso di un dato processo?
Addendum all'estrazione di stime per (e ):
Sono consapevole che se avessimo effettivamente risolto questo problema e avessimo contato gli eventi per ciascun processo, avremmo potuto adottare lo stimatore della massima verosimiglianza per e . Ovviamente lo stimatore della massima verosimiglianza esiste solo per campioni per i quali la varianza del campione è maggiore della media del campione, ma in tal caso potremmo impostare la funzione di verosimiglianza per osservazioni distribuite identicamente indipendenti as: da cui possiamo scrivere la funzione di verosimiglianza come: p N k 1 , k 2 , … , k N L ( r , p ) = N ∏ i = 1 P ( k i ; r , p ) , l ( r , p ) = N ∑ i = 1 ln ( Γ ( k i + r ) ) - N ∑ i