Come applicare il teorema di Bayes alla ricerca di un pescatore disperso in mare


19

L'articolo The Odds, continuamente aggiornato menziona la storia di un pescatore di Long Island che deve letteralmente la sua vita alle statistiche bayesiane. Ecco la versione breve:

Ci sono due pescatori su una barca nel cuore della notte. Mentre uno dorme, l'altro cade nell'oceano. La barca continua a trollare con il pilota automatico per tutta la notte fino a quando il primo ragazzo finalmente si sveglia e avvisa la Guardia Costiera. La Guardia Costiera utilizza un software chiamato SAROPS (Search and Rescue Optimal Planning System) per trovarlo appena in tempo, poiché era ipotermico e quasi senza energia per rimanere a galla.

Ecco la versione lunga: A Speck In The Sea

Volevo sapere di più su come il teorema di Bayes sia effettivamente applicato qui. Ho scoperto un bel po 'del software SAROPS semplicemente cercando su Google.

Il simulatore SAROPS

Il componente del simulatore tiene conto di dati tempestivi come la corrente oceanica, il vento, ecc. E simula migliaia di possibili percorsi di deriva. Da quei percorsi di deriva, viene creata una mappa di distribuzione delle probabilità.

Nota che la seguente grafica non si riferisce al caso del pescatore scomparso che ho menzionato sopra, ma è un esempio di giocattolo tratto da questa presentazione

Mappa delle probabilità 1 (il rosso indica la probabilità più alta; il blu la più bassa) inserisci qui la descrizione dell'immagine

Nota il cerchio che è la posizione iniziale.

Probability Map 2 - È trascorso più tempo inserisci qui la descrizione dell'immagine

Si noti che la mappa delle probabilità è diventata multimodale. Questo perché in questo esempio vengono considerati più scenari:

  1. La persona galleggia in acqua - modalità medio-alta
  2. La persona è in una zattera di salvataggio (più colpita dal vento proveniente dal Nord) - modalità 2 inferiori (divisa a causa di "effetti di jibing")

Probability Map 3 - La ricerca è stata condotta lungo i percorsi rettangolari in rosso inserisci qui la descrizione dell'immagine Questa immagine mostra i percorsi ottimali prodotti dal pianificatore (un altro componente di SAROPS). Come puoi vedere, quei percorsi sono stati cercati e la mappa delle probabilità è stata aggiornata dal simulatore.

Potresti chiederti perché le aree che sono state cercate non sono state ridotte a una probabilità zero. Questo perché c'è una probabilità di fallimento, , presa in considerazione, ovvero c'è una possibilità non trascurabile che il ricercatore trascuri la persona nell'acqua. Comprensibilmente, la probabilità di fallimento è molto più elevata per una persona sola a galla che per una persona in una zattera di salvataggio (più facile da vedere), motivo per cui le probabilità nella zona superiore non sono diminuite molto.p(fail)

Effetti di una ricerca fallita

È qui che entra in gioco il teorema di Bayes. Una volta effettuata una ricerca, la mappa delle probabilità viene aggiornata di conseguenza in modo che un'altra ricerca possa essere pianificata in modo ottimale.

Dopo aver esaminato il teorema di Bayes su wikipedia e nell'articolo Una spiegazione intuitiva (e breve) del teorema di Bayes su BetterExplained.com

Ho preso l'equazione di Bayes:

P(AX)=P(XA)×P(A)P(X)

E definito A e X come segue ...

  • Evento A: la persona è in quest'area (cella della griglia)

  • Test X: ricerca non riuscita su quell'area (cella della griglia), ovvero ricerca quell'area e non ha visto nulla

cedendo,

P(person thereunsuccessful)=P(unsuccessfulperson there)×P(person there)P(unsuccessful)

Ho trovato nel sistema di pianificazione ottimale ricerca e salvataggio che SAROPS calcola la probabilità di una ricerca fallita, , tenendo conto dei percorsi di ricerca e dei percorsi di deriva simulati. Quindi per semplicità supponiamo che sappiamo qual è il valore di .P(fail)P(fail)

Quindi ora abbiamo

P(person thereunsuccessful)=P(fail)×P(person there)P(unsuccessful)
  1. L'equazione di Bayes è applicata correttamente qui?

  2. Come verrebbe calcolato il denominatore, la probabilità di una ricerca fallita?

    Anche nel sistema di pianificazione ottimale di ricerca e salvataggio , dicono

    Le probabilità precedenti sono "normalizzate nel solito modo bayesiano" per produrre le probabilità posteriori

  3. Che cosa significa "normalizzato nella normale maniera bayesiana" ?

    Significa che tutte le probabilità sono divise per o semplicemente normalizzate per garantire che l'intera mappa delle probabilità si sommi a una? Oppure, sono la stessa cosa?P(unsuccessful)

  4. Infine, quale sarebbe il modo corretto di normalizzare la mappa delle probabilità con griglia dopo aver aggiornato per una ricerca non riuscita, considerando che poiché non hai cercato TUTTE le aree (celle della griglia) avresti alcune celle uguali a e alcuni uguali a ?P(person there)P(person thereunsuccessful)

Ancora un'altra nota di semplificazione: secondo Search and Rescue Optimal Planning System la distribuzione posteriore viene effettivamente calcolata aggiornando le probabilità dei percorsi di deriva simulati, e quindi rigenerando la mappa delle probabilità con griglia. Per mantenere questo esempio abbastanza semplice, ho scelto di ignorare i percorsi della sim e concentrarmi sulle celle della griglia.

Risposte:


6
  1. Supponendo che l'indipendenza tra le celle della griglia, sì, sembra che il Teorema di Bayes sia stato applicato correttamente.
  2. P(X)=P(X|A)P(A)+P(X|Ac)P(Ac)
    A P ( X | A c ) = 1AcAP(X|Ac)=1
  3. Non sono davvero sicuro di cosa significhi "normalizzare nella normale maniera bayesiana" da quando non ho scritto il manuale. Ma stanno sicuramente parlando del fatto che le seguenti tre equazioni sono sufficienti per trovare : Quindi non devi mai calcolare , ovvero la costante normalizzante. Se lo hanno usato per aggiornare la probabilità per una singola cella della griglia o per l'intera mappa, non lo so (probabilmente entrambi).P(A|X)
    P(A|X)P(X|A)P(A)P(Ac|X),P(X|Ac)P(Ac), and P(A|X)+P(Ac|X)=1
    P(X)
  4. Estendiamo la notazione di avere cella della griglia e l'evento l'individuo è in cella della griglia e essere il caso in cui cella della griglia è stato perquisito ed è stato trovato nessuno. Con la nuova notazione, sarà la raccolta di ricerche fallite. Partiamo dal presupposto che:iAiiXiiX

    • iP(Ai|X)=1 , ovvero dopo aver eseguito ricerche, la somma delle celle complessive della probabilità che l'individuo si trovi in ​​quella cella è 1. Questa è di nuovo la legge totale della probabilità.
    • Se assumiamo che la ricerca in una cella non ci dica nulla su qualsiasi altra cella, allora per le celle che sono state cercate e per celle che non sono state cercate . Se non assumiamo l'indipendenza, le formule saranno più complicate ma l'intuizione sarà simile, cioè calcolando fino a una costante di proporzionalità.P(Ai|X)=P(Ai|Xi)P(Xi|Ai)P(Ai)P(Ai|X)P(Ai)P(Ai|X)

    Possiamo usare questi due presupposti per calcolare e aggiornare la mappa di conseguenza.P(Ai|X)


Grazie per le eccellenti risposte;) Quindi, assumendo l'indipendenza della cella della griglia e , dopo aver cercato una volta ogni cella sarebbe valido calcolare per ogni cella e quindi dividere ogni cella per la somma di tutte le celle ( ) da normalizzare? P ( X | A ) P ( A ) i P ( X | A ) P ( A i )iP(Ai|X)=1P(X|A)P(A)iP(X|A)P(Ai)
mlai,

Mi sono appena reso conto che la ricerca di ogni cella con una probabilità fissa di fallimento non comporterebbe assolutamente alcun cambiamento nella distribuzione della probabilità :)
mlai,

Quindi, per riformulare ... Supponendo la legge della probabilità totale (come nella tua risposta a 4.), dopo che alcune (ma non tutte) le celle sono state perquisite potremmo normalizzare dividendo ciascuna cella per la somma di tutte le celle? ... usando per il valore delle celle che sono state cercate e per quelle che non lo sono. P ( A i )P(X|A)P(Ai)P(Ai)
mlai,

4

Mi è stato indicato un libro che ha un intero capitolo dedicato alla mia domanda - Analisi delle operazioni navali - da un ex professore che era un pilota di elicotteri e che ha effettivamente svolto missioni di ricerca e salvataggio, nientemeno!

Nel capitolo 8 viene fornito un esempio simile a questo (l'ho personalizzato un po '):

Per cominciare, c'è una distribuzione preventiva su griglia per l'ubicazione della persona o delle persone scomparse, della barca, ecc.

Distribuzione preventiva: Distribuzione preventiva

Viene eseguita una ricerca su parte della griglia e le probabilità vengono aggiornate con una distribuzione posteriore normalizzata applicando l'equazione di Bayes nello stesso modo in cui ho menzionato nelle mie domande:

P(target in (i,j)no detection)=P(no detectiontarget in (i,j))×P(target in (i,j))P(no detection)

dove (i, j) = (lat, long)

In questo caso, ho deciso di cercare la colonna 3 perché quella colonna aveva la maggiore probabilità precedente totale .

Distribuzione posteriore normalizzata dopo aver cercato la terza colonna w / pFail = 0.2: Distribuzione posteriore normalizzata (con probabilità di fallimento = 0,2)

La mia domanda riguardava principalmente il modo in cui il posteriore era normalizzato. Ecco come è stato fatto nel libro: dividi semplicemente ogni singola probabilità posteriore per la somma totale , S :

descrizione dell'immagine

Ho scelto una probabilità 0,2 di una ricerca fallita perché il mio professore aveva questo da dire: "Cerchiamo solo l'80% di probabilità di rilevamento perché questo è in genere il miglior compromesso tra tempestività e accuratezza".

Solo per i calci, ho eseguito un altro esempio con un pFail di 0,5. Considerando che nel primo esempio ( pFail = 0,2), il prossimo miglior percorso di ricerca (dato il posteriore normalizzato e ipotizzando ricerche in linea retta, nessuna diagonale o zig-zag) sarebbe quello di sorvolare la colonna 2, nel secondo esempio ( pFail = 0,5) il prossimo percorso migliore è sopra la riga 2.

Distribuzione posteriore normalizzata dopo aver cercato la terza colonna w / pFail = 0,5: Distribuzione posteriore normalizzata (con probabilità di fallimento = 0,5)

inserisci qui la descrizione dell'immagine

Ha anche aggiunto questo, "Gli aerei portano con sé una piccola lista di controllo per aiutare a determinare la migliore altitudine e velocità. Lavorare su un elicottero volante è come sedersi in cima a una lavatrice, leggere un libro che viene condotto su una lavatrice diversa".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.