Quale distribuzione utilizzare per modellare l'ora prima dell'arrivo di un treno?


15

Sto cercando di modellare alcuni dati sugli orari di arrivo del treno. Vorrei usare una distribuzione che catturi "più aspetto, più è probabile che il treno si presenti" . Sembra che una tale distribuzione dovrebbe apparire come un CDF, quindi P (treno mostrato | atteso 60 minuti) è vicino a 1. Quale distribuzione è appropriata da usare qui?


10
Se aspetti 25 ore e non c'è stato un treno, sospetto che la possibilità che un treno si presenti nel minuto successivo potrebbe essere vicino allo poiché è del tutto possibile che la linea sia stata chiusa temporaneamente o permanentemente0
Henry,

@ Henry, questo dipende interamente dalla tua fiducia nelle probabilità precedenti. Ad esempio, la stazione ferroviaria meno utilizzata in Gran Bretagna, theguardian.com/uk-news/2016/dec/09/… , ha lacune negli arrivi per più di un giorno (la domenica non è disponibile alcun servizio).
Sesto Empirico

@MartijnWeterings - forse grazie ai giornalisti, Shippea Hill ha visto un aumento del 1200% nell'utilizzo e non ha nemmeno fatto i 10 più bassi di utilizzo l'anno successivo , alcuni dei quali come l'aeroporto di Teesside hanno un treno a settimana in una direzione
Henry

Risposte:


17

Moltiplicazione di due probabilità

La probabilità di un primo arrivo alla volta tra t e t+dt (il tempo di attesa) è uguale alla moltiplicazione di

  • la probabilità di un arrivo tra t e t+dt (che può essere correlato alla velocità di arrivo s(t) al momento t )
  • e la probabilità di non arrivare prima del tempo t (o altrimenti non sarebbe il primo).

Quest'ultimo termine è legato a:

P(n=0,t+dt)=(1s(t)dt)P(n=0,t)

o

P(n=0,t)t=s(t)P(n=0,t)

dando:

P(n=0,t)=e0ts(t)dt

e la distribuzione di probabilità per i tempi di attesa è:

f(t)=s(t)e0ts(t)dt

Derivazione della distribuzione cumulativa.

In alternativa puoi usare l'espressione per la probabilità di meno di un arrivo a condizione che il tempo sia t

P(n<1|t)=F(n=0;t)

e la probabilità di arrivo tra il tempo t e t+dt è uguale alla derivata

farrival time(t)=ddtF(n=0|t)

Questo approccio / metodo è utile, ad esempio, nel derivare la distribuzione gamma come tempo di attesa per l'ennesimo arrivo in un processo di Poisson. ( tempo di attesa del processo di poisson segue la distribuzione gamma )


Due esempi

Potresti metterlo in relazione con il paradosso in attesa ( Spiega il paradosso in attesa ).

  • Distribuzione esponenziale: se gli arrivi sono casuali come un processo di Poisson, allora s(t)=λ è costante. La probabilità di un prossimo arrivo è indipendente dal precedente tempo di attesa senza arrivo (diciamo, se tiri un dado equo molte volte senza sei, quindi per il prossimo lancio non avrai improvvisamente una probabilità più alta per un sei, vedi l'errore del giocatore ) . Otterrai la distribuzione esponenziale e il pdf per i tempi di attesa è:

    f(t)=λeλt

  • TtS(t)=1/(T-t)

    f(t)=e0t-1T-tdtT-t=1T
    0T


Quindi è questo secondo caso, con "allora aumenta la probabilità di un arrivo, quando una persona è già in attesa da tempo" , che si riferisce alla tua domanda.

S(t)dt che un treno arrivi ad un certo momento potrebbe essere una funzione più complessa.


Scritto da StackExchangeStrike


7

La distribuzione classica per modellare i tempi di attesa è la distribuzione esponenziale .

La distribuzione esponenziale avviene naturalmente quando si descrivono le lunghezze dei tempi di inter-arrivo in un processo omogeneo di Poisson.


2
Sì, ma oserei dire che un processo di Poisson non è un buon modello per una rete ferroviaria.
lasciato circa il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.