Esempi di processi che non sono Poisson?


15

Sto cercando alcuni buoni esempi di situazioni inadatte a modellare con una distribuzione di Poisson, per aiutarmi a spiegare la distribuzione di Poisson agli studenti.

Uno usa comunemente il numero di clienti che arrivano in un negozio in un intervallo di tempo come esempio che può essere modellato da una distribuzione di Poisson. Sto cercando un controesempio in una vena simile, cioè una situazione che può essere considerata un processo di conteggio positivo in tempo continuo che chiaramente non è Poisson.

Idealmente, la situazione dovrebbe essere il più semplice e diretta possibile, in modo da facilitare la comprensione e la memorizzazione da parte degli studenti.


5
Questa domanda è straordinariamente ampia. A meno che l'ambito non sia ristretto e non sia stato aggiunto qualche altro contesto, è molto probabile che si chiuda. Senza senso sembrare inutilmente aspro, è come chiedere: "Quali sono alcuni esempi di fiori che non sono rossi?" (Cue Harry Chapin.)
Cardinale

1
Punto preso. Mie scuse. Avrei dovuto renderlo più specifico. L'ho modificato per cercare di renderlo più chiaro.
Nagel,

1
(+1) alla domanda e al commento. L'aggiornamento è molto meglio. :-)
Cardinale

2
Suppongo che intendi "determinati processi per i quali le persone potrebbero almeno ingenuamente considerare un Poisson" (ad esempio, almeno, un processo di conteggio). Un esempio comune si verifica nel numero di sinistri su polizze assicurative generali (assicurazioni danni) a causa di una serie di possibili fattori, il che ovviamente si riflette nell'eterogeneità dei tassi dei sinistri, quindi esiste una sovrapposizione dei processi di Poisson con intensità diverse. In situazioni in cui la distribuzione dei tassi di sinistri è ben approssimata da una distribuzione gamma, la distribuzione dei conteggi di sinistri è a sua volta approssimata da un binomio negativo.
Glen_b

Risposte:


5

Numero di sigarette fumate in un periodo di tempo: ciò richiede un processo a gonfiaggio zero (ad es. Poisson a gonfiaggio zero o binomio negativo a gonfiaggio zero) perché non tutti fumano sigarette.


Grazie! Molti qui hanno menzionato i processi a zero inflazione, ma penso che questo sia l'esempio più semplice e illustrativo che è stato dato: il numero di sigarette fumate da una persona scelta casualmente in un periodo di tempo.
Nagel,

C'è senza dubbio un intoppo con il "non tutti fumano sigarette" argomento, però, in che si potrebbe affermare che questo processo è ancora Poisson, solo che il parametro di intensità è specifico per ogni persona e sconosciuto (non fumatori avrebbero un molto piccolo intensità) - giusto? Tuttavia, si potrebbe anche sostenere che questa situazione viola le ipotesi di Poisson in quanto le sigarette fumate tenderanno ad essere distribuite uniformemente nel corso della giornata (per i fumatori regolari) o cluster (per i fumatori sociali) in modo che gli intervalli di tempo disgiunti non siano indipendenti. Quindi questo è ancora un buon esempio, penso.
Nagel,

1
Il numero di pesci catturati in un periodo di tempo è, credo, un esempio più canonico per ZIP e ZINB. Argomenti simili Sebbene i pesci non abbiano potenziali effetti di dipendenza sul tasso di consumo. (Lo so, lo so, tranne per il pesce di tua madre, perché sono così buoni :).
Alexis,

8

Intendi dati di conteggio positivi? Unbounded?

Il binomio negativo è popolare.

Un altro buon modello è il Poisson con 0. gonfiato. Quel modello presuppone che o stia succedendo qualcosa o no - e se lo è, segue un Poisson. Ho visto un esempio di recente. Agli infermieri che hanno curato i pazienti con AIDS è stato chiesto quanto spesso hanno sperimentato comportamenti stigmatizzanti da parte degli altri a causa del loro coinvolgimento con i pazienti con AIDS. Un gran numero non aveva mai avuto esperienze simili, probabilmente a causa di dove lavoravano o vivevano. Di quelli che hanno fatto, il numero di esperienze stigmatizzanti variava. Sono stati segnalati più 0 di quelli che ci si aspetterebbe da un semplice Poisson, fondamentalmente perché una certa proporzione del gruppo in studio semplicemente non si trovava in un ambiente che li esponesse a tali comportamenti.

Una miscela di Poisson ti darebbe anche un processo puntuale.


(+1) per la distribuzione di Poisson a gonfiaggio zero. Una discussione su questo modello può essere trovata qui

1
+1 a questo (e ad altre risposte) che forniscono esempi reali delle situazioni citate nella domanda, piuttosto che solo distribuzioni astratte. Questo esempio di ZIP è particolarmente chiaro.
whuber

1
A merito di coloro che hanno risposto, dovrei sottolineare che la mia domanda inizialmente era troppo sciatta e non si riferiva affatto alle situazioni. Concordo sul fatto che il Poisson gonfiato a zero sia un buon esempio. Tuttavia, trovo un po 'troppo complicato spiegare agli studenti universitari, quindi mi mancano ancora esempi di situazioni semplici che non possono essere modellate da una distribuzione di Poisson.
Nagel,

4

Conteggio dei processi che non sono Poisson? Bene, qualsiasi processo di spazio del campione finito come l'uniforme binomiale o discreta. Si ottiene un processo di conteggio di Poisson dal conteggio di eventi con tempi interarrival indipendenti che sono distribuiti in modo esponenziale, quindi un'intera serie di generalizzazioni si discosta da quella come avere tempi interarrival gamma o lognormali o Weibull distribuiti, o qualsiasi tipo di tempo interarrival astratto non parametrico distribuzione.


Grazie per la tua risposta, e mi dispiace molto che la mia domanda inizialmente non fosse chiara. L'ho chiarito ora. Quello che dici sui processi con tempi interarrival non esponenziali e / o dipendenti ha senso, ma hai qualche esempio di situazioni che avranno queste proprietà, più semplice è, meglio è?
Nagel,

4
Scommetti! Tempo tra focolai di herpes virus. Hai un tempo molto più lungo allo scoppio iniziale perché devi effettivamente contrarre il virus. I tempi interarrival tra le epidemie da allora in poi sono indipendenti l'uno dall'altro, ma arrivano a un ritmo molto più veloce rispetto all'epidemia. I tempi interarrival non esponenziali sono la norma. Nell'analisi di sopravvivenza, un metodo analitico comunemente usato sono i modelli di rischi proporzionali di Cox in cui si elimina qualsiasi ipotesi parametrica relativa ai tempi interarrival.
AdamO,

Buon esempio! Immagino che questo sia un altro esempio del Poisson gonfiato a zero menzionato da Placidia sopra?
Nagel,

4

Non è chiaro se si desidera o meno contare i processi.

Se interpreto il tag "insegnamento" significa che stai insegnando il processo di Poisson, allora, per insegnare un processo in generale, il processo di Bernoulli è un processo casuale facile da spiegare e visualizzare ed è correlato al processo di Poisson. Il processo di Bernoulli è l'analogo discreto, quindi potrebbe essere un utile concetto di accompagnamento. È solo che invece del tempo continuo abbiamo intervalli di tempo discreti.

Un esempio potrebbe essere un venditore porta a porta in cui contiamo i successi delle case che effettuano un acquisto.

  • Il numero di successi nelle prime n prove ha una
    distribuzione binomiale B (n, p) anziché un Poisson
  • Il numero di prove necessarie per ottenere r successi, ha una distribuzione binomiale negativa NB (r, p) invece di una distribuzione gamma
  • Il numero di prove necessarie per ottenere un successo, il tempo di attesa, ha una distribuzione geometrica NB (1, p), che è l'analogo discreto dell'esponenziale.

Questo è l'approccio che Bertsekas e Tsitsiklis usano in Introduzione alla probabilità , 2a ed., Introducendo il processo di Bernoulli prima del processo di Poisson. Nel loro libro di testo ci sono più estensioni al processo di Bernoulli che sono applicabili al processo di Poisson come unirle o partizionarle, così come risolvere i problemi con le soluzioni.

Se stai cercando esempi di processi casuali e vuoi semplicemente lanciare i nomi là fuori, ce ne sono parecchi.

Il processo gaussiano è significativo nelle applicazioni. Il processo di Weiner in particolare, che è un tipo di processo gaussiano, è anche chiamato moto browniano standard e ha applicazioni in finanza e fisica.


Grazie per la tua risposta, e mi dispiace molto che la mia domanda inizialmente fosse così improvvisata e poco chiara. Ho cercato di chiarirlo ora. Il collegamento da Bernoulli a Poisson è interessante, ma quello che sto cercando sono esempi di situazioni in tempo continuo che non sono adatte per essere modellate da una distribuzione di Poisson, più semplice è, meglio è.
Nagel,

3

Come attuario di proprietà / vittime, mi occupo di esempi di processi discreti nella vita reale che non sono sempre Poisson. Per le linee di business ad alta gravità e bassa frequenza, la distribuzione di Poisson è inadatta in quanto richiede un rapporto varianza-media di 1. La distribuzione binomiale negativa, menzionata sopra, è molto più comunemente usata e le distribuzioni Delaporte è usato in alcune pubblicazioni, sebbene meno spesso nella pratica attuariale nordamericana standard.

Perché è così è una domanda più profonda. Il binomio negativo è molto meglio perché rappresenta un processo di Poisson per il quale il parametro medio è esso stesso distribuito gamma? O è perché gli eventi di perdita non riescono all'indipendenza (come fanno gli eventi del terremoto secondo la teoria attuale che più si attende che la terra scivoli, più è probabile che sia dovuta all'accumulo di pressione), è non stazionario (gli intervalli non può essere suddiviso in sequenze, ognuna delle quali è fissa, il che consentirebbe l'uso di un Poisson non omogeneo), e certamente alcune linee di business consentono occorrenze simultanee (ad esempio negligenza medica con più medici coperti dalla polizza).


2

Altri hanno citato diversi esempi di processi puntuali che non sono Poisson. Poiché Poisson corrisponde a tempi interarrival esponenziali se si sceglie una distribuzione del tempo interarrival che non sia esponenziale, il processo del punto risultante non è Poisson. AdamO ha sottolineato il Weibull. È possibile utilizzare gamma, lognormale o beta come possibili opzioni.

Il Poisson ha la proprietà che la sua media è uguale alla sua varianza. Un processo puntuale che ha una varianza maggiore della media viene talvolta definito sovradisperso e se la media è maggiore della varianza è sottodispersa. Questi termini sono usati per mettere in relazione il processo con un Poisson. Il binomio negativo viene spesso utilizzato perché può essere sovradisperso o insufficiente a seconda dei suoi parametri.

Il Poisson ha una varianza costante. Un processo puntuale che si adatta alle condizioni di Poisson tranne per il fatto di non avere un parametro di velocità costante e di conseguenza una media e una varianza che variano nel tempo è chiamato Poisson disomogeneo.

Un processo con tempi interarrival esponenziali ma può avere più eventi al momento dell'arrivo è chiamato Poisson composto. Sebbene simili al processo di Poisson e aventi un nome con la parola Poisson in esso, i processi di Poisson disomogenei e composti sono diversi da un processo a punti di Poisson.


Grazie per la tua risposta, e mi dispiace molto che la mia domanda inizialmente fosse così improvvisata e poco chiara. Ho cercato di chiarirlo ora. Menzionate processi con tempi interarrival non esponenziali e / o dipendenti e ciò che dite su distribuzioni sovra e sottodisperse è molto interessante, ma avete qualche esempio di situazioni concrete che avranno queste proprietà? Più semplice è, meglio :)
Nagel,

1
Invece di provare a dare la mia risposta, penso che ci siano davvero molti, molti esempi che puoi trovare nei libri che trattano i processi di conteggio. Lasciatemi raccomandare di guardare il libro di Joe Hilbe sulla regressione binomiale negativa .
Michael R. Chernick,

2

Un altro esempio interessante di processo di conteggio non di Poisson è rappresentato dalla distribuzione di Poisson troncata a zero (ZTPD). ZTPD può adattarsi ai dati relativi al numero di lingue che le materie possono parlare in condizioni fisiologiche. In questo caso, la distribuzione di Poisson si comporta male, perché il numero di lingue parlate è per definizione> = 1: quindi 0 è escluso a priori.


2

Credo che potresti prendere il tuo processo Poisson all'arrivo del cliente e modificarlo in due modi diversi: 1) gli arrivi dei clienti sono misurati 24 ore al giorno, ma il negozio non è effettivamente aperto tutto il giorno e 2) immagina due negozi concorrenti con Poisson elabora i tempi di arrivo dei clienti e osserva la differenza tra gli arrivi nei due negozi. (L'esempio n. 2 deriva dalla mia comprensione del Manuale Springer di Engineering Statistics, Parte A Property 1.4.)


1

Potresti voler riconsiderare l'esempio di calcio. Sembra che le percentuali di punteggio per entrambe le squadre aumentino man mano che la partita continua e che cambiano quando le squadre cambiano le loro priorità di attacco / difesa in risposta al punteggio attuale.

O meglio, usalo come esempio di come i modelli semplici possano funzionare sorprendentemente bene, stimolando l'interesse nell'indagine statistica di alcuni fenomeni e fornendo un punto di riferimento per studi futuri che raccolgono più dati per investigare discrepanze e proporre elaborazioni.

Dixon & Robinson (1998), "Un modello di processo di nascita per le partite di calcio dell'Associazione", The Statistician , 47 , 3.


Avevo la sensazione che le partite di calcio non fossero del tutto Poisson, ma grazie per il riferimento :)
Nagel,

1

Poiché la domanda è correlata a rendere più comprensibile la distribuzione di Poisson, la proverò, dal momento che ho recentemente esaminato in qualche modo questo modello di call center in arrivo (che seguono una distribuzione esponenziale senza memoria con il passare del tempo).

Penso che approfondire un altro modello tangenziale che richiede essenzialmente la conoscenza di Poisson per rendersi conto che non è uno può essere un po 'confuso, ma sono solo io.

Penso che il problema con la comprensione di Poisson sia l'asse temporale continuo su cui si trova --- man mano che si verifica ogni secondo, non è più probabile che si verifichi l'evento --- ma più ci si allontana in futuro, più è sicuro di accadendo.

Davvero, penso che semplifichi la comprensione se si scambia l'asse "tempo" con "prove" o "eventi".

Qualcuno può correggermi se questo è lontano dalla base, poiché ritengo che sia una spiegazione facile, ma penso che tu possa sostituire il lancio di una moneta o il lancio di un dado, con "il tempo che arriva una telefonata" (cosa utilizzare in genere per il personale Erlang C / call center).

Invece di "tempo fino all'arrivo di una telefonata" ---- puoi sostituirlo con ... "lancia fino a quando un dado colpisce sei".

Ciò segue la stessa logica generale. La probabilità (come ogni gioco d'azzardo) è completamente indipendente ad ogni lancio (o minuto) ed è senza memoria. Tuttavia, la probabilità di "no 6" diminuisce sempre più lentamente ma sicuramente verso 0 quando si aumenta il numero di prove. È più facile se vedi entrambi i grafici (probabilità di chiamata con il tempo, rispetto alla probabilità di sei con i tiri).

Non so se abbia senso --- questo è ciò che mi ha aiutato a metterlo insieme in termini concreti. Ora, la distribuzione di Poisson è un conteggio piuttosto che "tempo tra chiamate" o "prove fino al lancio di sei" - ma si basa su questa probabilità.


Vedo come potresti pensare che ciò possa confondere gli studenti, ma la mia idea era semplicemente che mi avrebbe reso più semplice spiegare perché il numero di clienti che arrivano in un ristorante in un intervallo di tempo è Poisson, se avessi un contatore -esempio di un semplice processo con eventi discreti in tempo continuo che non era Poisson.
Nagel,

1
Ci sono molte opzioni, penso. Un modello ovvio sarebbero gli eventi che aumentano o diminuiscono in probabilità con le proprie occorrenze. Difficile pensare ad alcuni esempi. Forse le formiche arrivano nella tua cucina / picnic. Il tempo necessario per l'arrivo della prima formica è probabilmente molto più lungo della seconda o della terza, e ovviamente più arrivi di formiche significano più probabili futuri arrivi di formiche (dato che le loro tracce / comunicazione tra loro). Non sono sicuro se questo sarebbe importante.
John Babson,

1

Numero di visite di un singolo cliente al negozio di alimentari in un determinato intervallo di tempo.

Dopo essere stato al negozio di alimentari, è improbabile che tu ritorni per un po 'a meno che tu non abbia commesso un errore di pianificazione.

Penso che la distribuzione binomiale negativa potrebbe essere usata qui, ma è discreta, mentre le visite sono in tempo continuo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.