Per favore, spiega il paradosso in attesa


75

Alcuni anni fa ho progettato un rilevatore di radiazioni che funziona misurando l'intervallo tra gli eventi anziché contarli. La mia ipotesi era che, quando si misuravano campioni non contigui, in media avrei misurato metà dell'intervallo effettivo. Tuttavia, quando ho testato il circuito con una sorgente calibrata, la lettura era un fattore due troppo alto, il che significava che avevo misurato l'intero intervallo.

In un vecchio libro su probabilità e statistiche ho trovato una sezione su qualcosa chiamato "The Waiting Paradox". Ha presentato un esempio in cui un autobus arriva alla fermata ogni 15 minuti e un passeggero arriva a caso, affermando che il passeggero avrebbe aspettato in media tutti i 15 minuti. Non sono mai stato in grado di capire la matematica presentata con l'esempio e continuo a cercare una spiegazione. Se qualcuno può spiegare perché è così che il passeggero aspetta l'intero intervallo, dormirò meglio.


1
Qual è il titolo e chi è l'autore del libro? Potresti copiare l'esempio parola per parola qui?
Joel Reyes Noche,

Questa non è la mia specialità, ma il paradosso menzionato dall'OP è lo stesso del paradosso dell'ispezione ?
Joel Reyes Noche,


1
Sembra che la mia ipotesi sopra abbia qualche supporto. Un commento a questa risposta menziona il paradosso dell'ispezione.
Joel Reyes Noche,

2
Penso che usare un bus come l'analogia sia confuso, poiché i bus tendono a seguire gli orari. Pensa invece a quanto tempo ci vorrà per arrivare un taxi vuoto quando in media uno arriva ogni 15 minuti.
Harvey Motulsky,

Risposte:


48

1515WR

(1)E(W)=12R=152=7.5

e abbiamo ragione.

15R

(2)E(W)=12E(R)=152=7.5WRONG

RE(R)15

(1)015

15(2)15E(R)(2)15

Quindi forse dovremmo calcolare il valore atteso della lunghezza massima tra due arrivi di autobus consecutivi, è questa la soluzione corretta?

f()=λeλ,λ=1/15,E()=15

Ciò è approssimativo, naturalmente, poiché la distribuzione esponenziale ha un supporto illimitato da destra, il che significa che in termini rigorosi "tutti i possibili tempi di attesa" includono, sotto questo presupposto modellistico, grandi e grandi dimensioni fino a "compreso" l'infinito, ma con probabilità che svaniscono .

Ma l'attesa, l'esponenziale è senza memoria : non importa a che punto nel tempo ci arriveremo, ci troviamo di fronte la stessa variabile casuale , indipendentemente da ciò che è accaduto prima.

1515


f()fλ()

fX(y)

80

Se l'autobus arriva "ogni 15 minuti" (ovvero in base a un programma), l'attesa media del passeggero (in arrivo casuale) è effettivamente di soli 7,5 minuti, perché sarà distribuita uniformemente in quell'intervallo di 15 minuti.

-

Se, d'altra parte, l'autobus arriva in modo casuale alla velocità media di 4 all'ora (cioè secondo un processo di Poisson), allora l'attesa media è molto più lunga; in effetti puoi risolverlo tramite la mancanza di proprietà di memoria. Prendi l'arrivo del passeggero come inizio e il tempo per il prossimo evento è esponenziale con una media di 15 minuti.

Vorrei prendere un'analogia del tempo discreto. Immagina che sto lanciando un dado con 15 facce, una delle quali è etichettata "B" (per bus) e 14 etichettata "X" per l'assenza totale di bus in quel minuto ( esistono dadi discreti a 30 facce , quindi potrei etichettare 2 dei facce di un dado a 30 facce "B"). Quindi una volta al minuto torno e vedo se arriva l'autobus. Il dado non ha memoria; non sa quanti tiri dall'ultima "B" siano stati. Ora immagina che accada un evento non collegato: un cane abbaia, arriva un passeggero, sento un rombo di tuono. Da ora, quanto tempo aspetterò (quanti tiri) fino alla prossima "B"?

A causa della mancanza di memoria, in media, aspetto la stessa "B" successiva come il tempo tra due "B" consecutive.

[Ora immagino di avere un dado a 60 facce che tiro ogni quindici secondi (di nuovo, con una faccia "B"); ora immagino di avere un dado a 1000 facce che ho lanciato ogni 0,9 secondi (con una faccia "B"; o più realisticamente, tre dadi a 10 facce ciascuno e chiamo il risultato una "B" se tutti e 3 escono "10" a allo stesso tempo) ... e così via. Nel limite, otteniamo il processo continuo di Poisson.]

tt

Come un veterano che cattura gli autobus, in pratica la realtà sembra trovarsi a metà strada tra "gli autobus arrivano in orario" e "gli autobus arrivano a caso". E a volte (con traffico scarso), aspetti un'ora e poi 3 arrivano tutti in una volta (Zach identifica la ragione nei commenti qui sotto).


6
Penso che con gli autobus in particolare ci sia un processo aggiuntivo in cui un autobus in ritardo diventa più tardi quando i passeggeri si arrampicano su di esso e l'autobus vuoto dietro di esso alla fine raggiunge (ma rimane vuoto). = D
Zach,

4
@Zach in effetti, ecco perché tendono a raggrupparsi per lunghe distanze, specialmente nel traffico intenso. Dove vivo quando l'autobus funziona così tardi è ora del prossimo, a volte inseriranno un autobus aggiuntivo che è quasi in orario più lungo lungo il percorso (cioè guiderà senza passeggeri verso un autobus che non sarebbe molto indietro orario, spesso arrivando lì attraverso un percorso più veloce) e iniziare a prendere i passeggeri per i quali ora l'autobus è solo un po 'in ritardo. Nel frattempo, l'autobus molto in ritardo ora diventa effettivamente il prossimo autobus nell'orario, una volta arrivato a dove è arrivato l'altro autobus.
Glen_b

@Glen_b È davvero una buona idea, eh!
Zach,

È un'utile strategia anti-agglomerante (almeno, mitiga i casi peggiori); Non l'avrei menzionato, tranne per il fatto che riguarda il tipo di problemi di dipendenza che potrebbero essere necessari modelli di tempo di attesa bus più precisi.
Glen_b,

10

Altro sugli autobus ... Mi dispiace buttarmi nella conversazione così tardi nella discussione, ma ultimamente ho esaminato i processi di Poisson ... Quindi prima che mi sfugga di mente, ecco una rappresentazione pittorica del paradosso delle ispezioni :

λθ=1/λ=15

Se fossimo in un centro di spedizione e potessimo vedere tutti gli autobus su uno schermo, sarebbe vero che prelevare casualmente più autobus e calcolare la media della distanza che segue dietro gli autobus produrrebbe il tempo medio tra gli arrivi:

inserisci qui la descrizione dell'immagine

Ma se quello che invece facciamo è solo presentarci alla stazione degli autobus (invece di selezionare un autobus), stiamo facendo una sezione casuale del tempo, diciamo, lungo la linea temporale dell'orario degli autobus in una tipica mattina. Il momento in cui decidiamo di presentarci alla stazione degli autobus potrebbe benissimo essere distribuito uniformemente lungo la "freccia" del tempo. Tuttavia, poiché ci sono intervalli di tempo più lunghi tra gli autobus che si espandono più lontano, è più probabile che finiscano per sovracampionare questi "sbandati":

inserisci qui la descrizione dell'immagine

... e quindi, il nostro registro del tempo di attesa non rifletterà il tempo di arrivo. Questo è il paradosso dell'ispezione.

15θ=15

E[time waiting (future) + time to last bus departure (past)]=30


inserisci qui la descrizione dell'immagine


Ancora poco chiaro? - provalo con Legos .


Diagrammi eccellenti.
Glen_b

2

C'è una semplice spiegazione che risolve le diverse risposte che si ottengono dal calcolo del tempo di attesa previsto per gli autobus in arrivo per un processo di Poisson con un dato tempo interarrival medio (in questo caso 15 minuti), i cui tempi interarrival sono quindi esponenziali con una media di 15 minuti .

Metodo 1 ) Poiché il processo di Poisson (esponenziale) è privo di memoria, il tempo di attesa previsto è di 15 minuti.

Metodo 2 ) È altrettanto probabile che arrivi in ​​qualsiasi momento durante il periodo interarrival in cui arrivi. Pertanto il tempo di attesa previsto è 1/2 della lunghezza prevista di questo periodo interarrival. QUESTO È CORRETTO e non è in conflitto con il metodo (1).

Come possono essere corretti (1) e (2) entrambi? La risposta è che la durata prevista del periodo interarrival per il momento in cui arrivi non è di 15 minuti. In realtà sono 30 minuti; e 1/2 di 30 minuti sono 15 minuti, quindi (1) e (2) sono d'accordo.

Perché il periodo interarrival per il momento in cui arrivi non è uguale a 15 minuti? È perché prima "fissando" un orario di arrivo, il periodo interarrival in cui si trova è più probabile della media di essere un lungo periodo interarrival. Nel caso di un periodo interarrival esponenziale, la matematica si risolve quindi il periodo interarrival contenente il tempo in cui arrivi è un esponenziale con un tempo interarrival medio doppio per il processo di Poisson.

Non è ovvio che l'esatta distribuzione per il tempo interarrival contenente l'ora in cui si arriva sarebbe esponenziale con una media raddoppiata, ma è ovvio, dopo una spiegazione, perché è aumentata. Per un esempio di facile comprensione, supponiamo che i tempi interarrival siano di 10 minuti con probabilità 1/2 o 20 minuti con probabilità 1/2. In questo caso, è probabile che si verifichino periodi interarrival lunghi 20 minuti come periodi interarrival lunghi 10 minuti, ma quando si verificano, durano il doppio del tempo. Quindi, 2/3 dei punti temporali durante il giorno saranno in momenti in cui il periodo interarrival è di 20 minuti. Detto in altro modo, se prima scegliamo un orario e poi vogliamo sapere qual è il tempo interarrival contenente quel tempo, quindi (ignorando gli effetti transitori all'inizio del "giorno" ) la durata prevista di quel tempo interarrival è di 16 1/3. Ma se prima selezioniamo il tempo interarrivalo e vogliamo sapere qual è la sua durata prevista, sono 15 minuti.

Esistono altre varianti del paradosso del rinnovamento, campionamenti di lunghezza differenziata, ecc., Che equivalgono praticamente alla stessa cosa.

Esempio 1) Hai un gruppo di lampadine, con una durata casuale, ma una media di 1000 ore. Quando una lampadina si guasta, viene immediatamente sostituita da un'altra lampadina. Se scegli un momento per andare in una stanza con la lampadina, la lampadina in funzione si concluderà con una durata media più lunga di 1000 ore.

Esempio 2) Se andiamo in un cantiere in un determinato momento, allora il tempo medio fino a quando un operaio edile che lavora lì in quel momento cade dall'edificio (da quando hanno iniziato a lavorare) è maggiore del tempo medio fino al lavoratore cade (da quando hanno iniziato a lavorare) tra tutti i lavoratori che iniziano a lavorare. Perché, perché i lavoratori con un tempo medio breve fino alla caduta sono più probabili della media di essere già caduti (e non hanno continuato a lavorare), così che i lavoratori che lavorano hanno quindi tempi più lunghi della media fino alla caduta.

Esempio 3) Scegli un numero modesto di persone a caso in una città e se hanno partecipato alle partite in casa (non tutte esaurite) della squadra di baseball della Major League della città, scopri quante persone hanno partecipato alle partite in cui si trovavano. Quindi (in base ad alcuni presupposti leggermente idealizzati ma non troppo irragionevoli), la presenza media per quelle partite sarà superiore alla frequenza media per tutte le partite in casa della squadra. Perché? Perché ci sono più persone che hanno partecipato a giochi ad alta frequenza rispetto ai giochi a bassa frequenza, quindi è più probabile che tu scelga persone che hanno partecipato a giochi ad alta frequenza rispetto ai giochi a bassa frequenza.


0

La domanda posta era "... un autobus arriva alla fermata ogni 15 minuti e un passeggero arriva a caso." Se l'autobus arriva ogni 15 minuti, non è casuale; arriva ogni 15 minuti, quindi la risposta corretta è di 7,5 minuti. O la fonte è stata erroneamente citata o lo scrittore della fonte era sciatto.

D'altra parte, il rilevatore di radiazioni sembra un problema diverso perché gli eventi di radiazione arrivano in modo casuale secondo una certa distribuzione, presumibilmente qualcosa come Poisson con un tempo di attesa medio.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.