È un modo corretto per aggiornare continuamente una probabilità usando il teorema di Bayes?


9

Diciamo che sto cercando di scoprire la probabilità che il gusto preferito del gelato di qualcuno sia la vaniglia.

So che alla persona piacciono anche i film horror.

Voglio scoprire la probabilità che il gelato preferito della persona sia la vaniglia dato che gli piacciono i film horror.

Conosco le seguenti cose:

  1. 5% delle persone sceglie la vaniglia come il suo gusto preferito di gelato. (Questa è la mia )P(A)
  2. 10% delle persone il cui preferito è il gelato alla vaniglia ama anche i film horror. (Questa è la mia )P(B|UN)
  3. 1% delle persone il cui preferito non è il gelato alla vaniglia amano anche i film horror (Questa è la mia )P(B|¬UN)

Quindi, lo calcolo in questo modo: Trovo che (arrotondato al decimo millesimo più vicino). C'è una probabilità del che il gusto preferito del gelato di un film horror sia la vaniglia. P(A|B)=0,344834,48%

P(UN|B)=0.05×0.1(0.05×0.1)+(0.01×(10.05))
P(A|B)=0.344834.48%

Ma poi ho imparato che la persona ha visto un film horror negli ultimi 30 giorni. Ecco quello che so:

  1. P ( A )34.48% è la probabilità posteriore aggiornata che la vaniglia sia il gusto di gelato preferito dalla persona: la in questo prossimo problema.P(A)
  2. 20% delle persone il cui preferito è il gelato alla vaniglia ha visto un film horror negli ultimi 30 giorni.
  3. 5% delle persone il cui preferito non è il gelato alla vaniglia ha visto un film horror negli ultimi 30 giorni.

Questo dà: quando arrotondato.

0,3448×0.2(0,3448×0.2)+(0.05×(1-0,3448))=0,6779

Quindi ora credo che ci sia una probabilità del che il fan del film horror ami il gelato dato che hanno visto un film horror negli ultimi 30 giorni.67.79%

Ma aspetta, c'è un'altra cosa. Ho anche imparato che la persona possiede un gatto.

Ecco quello che so:

  1. P ( A )67.79% è la probabilità posteriore aggiornata che la vaniglia sia il gusto preferito del gelato della persona: la in questo prossimo problemaP(UN)
  2. 40% delle persone il cui preferito è il gelato alla vaniglia possiede anche i gatti
  3. 10% delle persone il cui preferito non è il gelato alla vaniglia possiede anche i gatti

Questo dà: quando arrotondato.

0,6779×0.4(0,6779×0.4)+(0.1×(1-0,6779))=0,8938

La mia domanda si riduce sostanzialmente a questo: sto aggiornando correttamente la probabilità usando il teorema di Bayes? Sto sbagliando qualcos'altro nei miei metodi?


1
amore = preferito? non stai pubblicando gradi di amore. se lo ami, è il tuo preferito. chiarire se necessario.
generic_user

Buon punto. Ho cambiato "amore" in "preferito". Non è grammaticalmente corretto, ma è meno prolisso del dire "scegli la vaniglia per il loro gusto preferito di gelato". Spero che chiarisca le cose.
user1626730

Risposte:


7

Questo non è corretto L'aggiornamento sequenziale di questo tipo funziona solo quando le informazioni che stai ricevendo in sequenza sono indipendenti (ad es. Osservazioni di una variabile casuale). Se ogni osservazione non è indipendente, come in questo caso, è necessario considerare la distribuzione di probabilità congiunta. Il modo corretto di aggiornare sarebbe di tornare al precedente, trovare la probabilità comune che qualcuno ami i film horror, abbia visto un film horror negli ultimi 30 giorni e possieda un gatto dato che fanno o non scelgono la vaniglia come loro sapore di gelato preferito, quindi aggiorna in un solo passaggio.

L'aggiornamento sequenziale in questo modo quando i tuoi dati non sono indipendenti porterà rapidamente la tua probabilità posteriore molto più in alto o più in basso di quanto dovrebbe essere.


1
Come intendi "quando le informazioni che ricevi in ​​sequenza sono indipendenti?" Se intendi "indipendente dall'evento che stai tentando di prevedere", sai come posso sapere se le informazioni che sto ricevendo sono indipendenti?
user1626730

Condizionalmente indipendente dato l'evento che si sta tentando di prevedere. Se fossero indipendenti dall'evento che stai tentando di prevedere, non ti farebbero bene. Per quanto riguarda come puoi dirlo, devi pensare a quali sono i tuoi dati. In questo caso, se qualcuno ha visto un film horror negli ultimi 30 giorni non è chiaramente indipendente dal fatto che amino i film horror.
Jonathan Christensen,

Quando dici "condizionatamente indipendente", suppongo che intendi dire che ogni P (B) (cioè, film horror-amante, proprietà di un gatto) non sono correlati l'uno con l'altro? In tal caso, la variabile di proprietà del gatto non sarebbe indipendente dall'amore per il film horror?
user1626730

Sì, puoi sostenere che la proprietà del gatto è indipendente dall'amore per il film horror. Tuttavia, non è necessariamente, per esempio, forse le donne hanno più probabilità di amare i gatti e meno probabilità di amare i film dell'orrore.
Jonathan Christensen,

Hm, non sono del tutto sicuro di cosa intendi aggiungendo qualcosa su donne e gatti. Potresti spiegare ulteriormente, per favore?
user1626730
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.