Qual è l'intuizione dietro la formula della probabilità condizionale?


30

La formula per la probabilità condizionale di accadendo dato che è successo è:AB

P(A | B)=P(AB)P(B).

Il mio libro di testo spiega l'intuizione dietro questo in termini di diagramma di Venn.

inserisci qui la descrizione dell'immagine

Dato che si è verificato , l'unico modo in cui si verifica è che l'evento cada nell'intersezione di e .BAAB

In tal caso, la probabilità di P(A|B) non sarebbe semplicemente uguale alla probabilità di A intersezione B , dal momento che è l'unico modo in cui l'evento potrebbe accadere? Cosa mi sto perdendo?


7
Hai una comprensione intuitiva di quale sia la probabilità condizionata "," se dimentichiamo per un po 'come calcolarla?
Juho Kokkala,

4
Condizionando su B (l'evento che si è verificato), restringi il tuo spazio di risultati da (l'intero piano) solo a B. Dimentichi tutto ciò che è al di fuori di B. La probabilità dell'evento A deve essere misurata rispetto a B, poiché la probabilità è compresa tra 0 e 1.Ω
Vladislavs Dovgalecs

1
Ti stai perdendo il fatto che la parte bianca dell'evento A non fa più parte della popolazione una volta che sai che si è verificato l'evento B.
Monty Harder,

4
Le intuizioni non sono esatte, né sono singolari, quindi perché chiedere dell'intuizione (singolare) esatta? Un'intuizione utile è sufficiente, ma non tutti i suggerimenti saranno utili a tutte le persone.
John Coleman,

Risposte:


23

Una buona intuizione è data dal fatto che B si è verificato - con o senza A - qual è la probabilità di A? Cioè, ora siamo nell'universo in cui si è verificata la B: il cerchio completamente a destra. In quel cerchio, la probabilità di A è l'area di A interseca B divisa per l'area del cerchio.


5
In altre parole, ti dico che successo, il che significa che viviamo nel cerchioIn quel mondo, quale% di eventi è nell'obiettivo ( )? B A BBBAB
MichaelChirico,

18

Ci penserei così: do per scontato che tu capisca l'intuizione fino a quando:

Dato che si è verificato B, l'unico modo per far sì che A si verifichi è che il pari cada nell'intersezione di A e B.

e ho intenzione di commentare la seconda immagine che hai pubblicato:

  1. Immagina che l'intero rettangolo bianco sia il tuo spazio campione .Ω

    Assegnare una probabilità a un set significa che stai misurando in un certo senso quel set. È come se misurassi l'area del rettangolo, ma la probabilità è un diverso tipo di misura che ha proprietà specifiche (non dirò altro al riguardo).

  2. Sai che e questo viene interpretato in questo modo:P(Ω)=1

    Ω rappresenta tutti gli eventi che potrebbero accadere e qualcosa deve accadere, quindi abbiamo il 100% di probabilità che qualcosa accada.

  3. Analogamente il set di ha una probabilità che è proporzionale alla probabilità di spazio campionario . Graficamente parlando vedi che quindi la misura di (la sua probabilità ) deve essere inferiore a . Lo stesso ragionamento vale per il set di . Questo set può essere misurato e la sua misura è .P (AP(A)A Ω A P ( A ) P ( Ω ) A B P ( A B )ΩAΩAP(A)P(Ω)ABP(AB)

  4. Se ora ti viene detto che è successo, devi pensare come se fosse il tuo "nuovo" . Se è il vostro "nuovo" allora si può essere sicuri al 100% che tutto avviene nel set .B Ω B Ω BBBΩBΩB

    E cosa significa? Significa che ora, nel "nuovo" contest , e devi ridimensionare tutte le misure di probabilità, tenendo conto che devono essere espresse in termini di "nuovo" spazio campione . È una proporzione semplice.BP(BB)=1B

    Il tuo intuito è quasi giusto quando dici che:

la probabilità di P (A | B) sarebbe semplicemente uguale alla probabilità di A intersezione B

e il "quasi" è dovuto al fatto che ora il tuo spazio campione è cambiato ( adesso è ) e vuoi ridimensionare conseguenza.P ( A B )BP(AB)

  1. P ( A B ) BP(AB) è il vostro nel nuovo mondo in cui lo spazio campionario è ora . A parole lo diresti così (e per favore prova a visualizzarlo sull'immagine con i set):P(AB)B

    Nel nuovo mondo il rapporto tra la misura di e la misura di deve essere lo stesso del rapporto tra la misura di e la misura diA B Ω A BBABΩAB

  2. Infine traducilo in linguaggio matematico (una proporzione semplice):

P(B):P(AB)=P(Ω):P(AB)

e poiché segue che:P(Ω)=1

P(AB)=P(AB):P(B)

5

Vedrai l'intuizione pensare facilmente al seguente problema.

Supponiamo di avere 10 palline: 6 nere e 4 rosse. Di palle nere 3 sono fantastici e di palle rosse solo 1 è fantastico. Quanto è probabile che anche una palla nera sia fantastica?

La risposta è molto semplice: è del 50%, perché abbiamo 3 fantastiche palle nere su un totale di 6 palle nere.

Ecco come mappare le probabilità al nostro problema:

  • 3 palline nere e fantastiche corrispondono aP(AB)
  • 6 palline nere corrispondono aP(B)
  • probabilità che una palla sia Fantastica quando SAPPIAMO che è Nero:P(AB)

1
Non avrebbe più senso scrivere anziché ? P ( B ) = 6n(B)=6P(B)=6
Silverfish

@Silverfish Sarebbe più preciso, ma ero dopo l'intuizione in questo caso
Aksakal

4

Per un'intuizione di base della formula della probabilità condizionale, mi piace sempre usare una tabella a due vie. Diciamo che ci sono 150 studenti in un gruppo di anni, di cui 80 femmine e 70 maschi, ognuno dei quali deve studiare esattamente un corso di lingua. La tabella bidirezionale degli studenti che seguono corsi diversi è:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

Dato che uno studente frequenta il corso di italiano, qual è la probabilità che siano donne? Bene, il corso di italiano ha 60 studenti, di cui 40 femmine che studiano italiano, quindi la probabilità deve essere:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

dove è la cardinalità dell'insieme , ovvero il numero di elementi che contiene. Nota che dovevamo usare nel numeratore e non solo , poiché quest'ultimo avrebbe incluso tutte e 80 le femmine, comprese le altre 40 chi non studia italiano.A n ( F italiano ) n ( F )n(A)An(FItalian)n(F)

Ma se la domanda fosse capovolta, qual è la probabilità che uno studente segua il corso di italiano, dato che sono donne? Quindi 40 delle 80 studentesse seguono il corso di italiano, quindi abbiamo:

P(Italian|F)=n(ItalianF)n(F)=4080=12

Spero che questo fornisca intuizione al perché

P(A|B)=n(AB)n(B)

Comprendere perché la frazione può essere scritta con probabilità anziché con cardinalità è una questione di frazioni equivalenti . Ad esempio, torniamo alla probabilità che uno studente sia una donna dato che stanno studiando italiano. Ci sono 150 studenti in totale, quindi la probabilità che uno studente sia femmina e studi italiano è 40/150 (questa è una probabilità "congiunta") e la probabilità che uno studente studi italiano è 60/150 (questa è una probabilità "marginale" ). Si noti che la divisione della probabilità congiunta per la probabilità marginale dà:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(Per vedere che le frazioni sono equivalenti, moltiplicando numeratore e denominatore per 150 rimuove il "/ 150" in ciascuno.)

Più in generale, se il tuo spazio di campionamento ha cardinalità - in questo esempio la cardinalità era 150 - troviamo chen ( Ω )Ωn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

Vorrei invertire la logica. La probabilità che sia che sia:BAB

  1. La probabilità avvenuta e quella data che avvenuta.ABA
  2. Stessi ma ruoli inversi per eBAB

Questo ti darà

p(AB)=p(B)p(AB)

Se stai cercando un aspetto negativo al tuo suggerimento, è vero che la probabilità che data sia contenuta nella probabilità del prodotto, lo spazio in cui stai tirando i dadi è più piccola del tuo spazio di probabilità originale - sai sicuramente sei "in" , quindi dividi per le dimensioni del nuovo spazio.B BABB


2

Il diagramma di Venn non rappresenta la probabilità, rappresenta la misura dei sottoinsiemi dello spazio eventi. Una probabilità è il rapporto tra due misure; la probabilità di X è la dimensione di "tutto ciò che costituisce X" ha diviso la dimensione di "tutti gli eventi considerati". Ogni volta che stai calcolando una probabilità, hai bisogno sia di uno "spazio di successo" che di uno "spazio di popolazione". Non puoi calcolare una probabilità basandoti solo su "quanto è grande" lo spazio di successo. Ad esempio, la probabilità di tirare un sette con due dadi è il numero di modi di tirare un sette diviso per il numero totale di modi di tirare due dadi. Basta conoscere il numero di modi per ottenere un sette non è sufficiente per calcolare la probabilità. P (A | B) è il rapporto tra la misura di "accadono sia A che B" spazio e la misura dello spazio "B accade". Questo è ciò che il "|" significa: significa "rendere ciò che viene dopo questo spazio di popolazione".


2

Penso che il modo migliore per pensarci sia disegnare percorsi passo-passo.

Descriviamo l'Evento B come tirare un su un dado equo: si può facilmente dimostrare che ha probabilità . Ora descriviamo l'Evento A come pescare un Asso da un mazzo di carte standard da 52 carte - questo può essere facilmente dimostrato avere probabilità .14 116113

Eseguiamo ora un esperimento in cui tiriamo un dado e quindi scegliamo una carta. Quindi sarebbe la probabilità che pesciamo un Asso, dato che abbiamo già ottenuto un . Se guardi l'immagine, questo sarebbe il percorso (vai su) e poi il percorso (vai di nuovo su). 4 1P(A|B)4 116113

Intuitivamente, lo spazio di probabilità totale è ciò che ci è già stato dato: rotolare il . Possiamo ignorare e il percorso iniziale verso il basso conduce, dato che è stato DATO che abbiamo ottenuto un . Per legge della moltiplicazione, il nostro spazio totale è quindi .14 12113 4(112134(16×113)+(16×1213)

Ora qual è la probabilità che abbiamo pescato un asso, DATO che abbiamo tirato un ? La risposta usando il percorso è , che dobbiamo quindi dividere per lo spazio totale. Quindi otteniamo4(16×113)

P(A|B)=16×113(16×113)+(16×1213).

inserisci qui la descrizione dell'immagine


2
Mi chiedevo a cosa servisse il downvote, perché gli alberi probabilistici possono essere molto istruttivi. Forse la preoccupazione è che l'uso di eventi indipendenti per l'illustrazione manchi il punto stesso della probabilità condizionale, che è che la distribuzione della probabilità può cambiare a seconda dell'evento di condizionamento. L'uso di un'illustrazione meno superficiale può aiutare.
whuber

1

Pensaci in termini di conteggi. La probabilità marginale è quante volte si è verificato A diviso per la dimensione del campione. La probabilità congiunta di A e B è quante volte si è verificato A insieme a B diviso per la dimensione del campione. La probabilità condizionale di A data B è quante volte A si è verificata insieme a B divisa per quante volte si è verificata B, vale a dire solo A "all'interno" di B.

Puoi trovare una bella illustrazione visiva su questo blog , che lo mostra usando i blocchi Lego.


1

Al momento della stesura ci sono circa 10 risposte che sembrano mancare a tutti il ​​punto più importante: in sostanza hai ragione.

In tal caso, la probabilità di P (A | B) non sarebbe semplicemente uguale alla probabilità di intersezione A, poiché questo è l'unico modo in cui l'evento potrebbe accadere?

Questo è sicuramente vero. Questo spiega perché la quantità che definiamo è in realtà riscalata.P(A|B)P(AB)

Cosa mi sto perdendo?

Ti manca che la probabilità che B sia soddisfatta dato che B è soddisfatto dovrebbe essere 1 poiché si tratta di un evento piuttosto certo, e non che può ben essere inferiore a 1. Divisione per rende la probabilità condizionata di B data B pari a 1, come previsto. In realtà questo è ancora meglio e rende la mappa una probabilità, quindi una probabilità condizionata è in realtà una probabilità.P(BB)=P(B)P(B)AP(A|B)


0

Ritengo sia più intuitivo quando disponiamo di dati concreti per stimare le probabilità.

Usiamo i mtcarsdati come esempio, i dati assomigliano a questo (usiamo solo il numero di cilindri e il tipo di trasmissione).

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Possiamo calcolare la distribuzione congiunta su due variabili facendo una tabella incrociata:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

La probabilità congiunta significa che vogliamo considerare due variabili contemporaneamente. Ad esempio, chiederemo quante auto sono 4 cilindri e cambio manuale.

Ora arriviamo alla probabilità condizionata. Ho trovato il modo più intuitivo per spiegare la probabilità condizionale è usare il termine filtro sui dati.

Supponiamo di voler ottenere , faremo le seguenti stime:P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

Questo significa che ci preoccupiamo solo delle auto con 4 cilindri. Quindi filtriamo i dati su questo. Dopo il filtraggio, controlliamo quanti di essi sono trasmissione manuale.

Puoi confrontare questo condizionatamente con quello che ho menzionato prima per sentire le differenze.


0

Se Afosse un superset della Bprobabilità che ciò Aaccada è sempre 1 dato che è Bsuccesso, cioè P(A|B) = 1. Tuttavia, Bpuò avere una probabilità molto inferiore a 1.

Considera il seguente esempio:

  • dato xè un numero naturale in 1..100,
  • Aè " xè un numero pari"
  • Bis ' xè divisibile per 10'

abbiamo quindi:

  • P(A) è 0,5
  • P(B) è 0.1

Se sappiamo che xè divisibile per 10 (cioè xè in B) sappiamo che è anche un numero pari (cioè xè in A) così P(A|B) = 1.

Dalla regola di Bayes abbiamo:

P(A|B)=P(AB)P(B)

si noti che nel nostro caso (speciale) , cioè la probabilità che sia un numero pari e un numero divisibile per 10 è uguale alla probabilità che sia un numero divisibile per 10. Pertanto abbiamo e ricollegandolo alla regola di Bayes otteniamo .P ( A B ) = P ( B ) P ( A | B ) = P ( B ) / P ( B ) = 1P(AB)xxP(AB)=P(B)P(A|B)=P(B)/P(B)=1


Per un esempio non degenerato si consideri ad es. AÈ ' xè divisibile per 7' ed Bè ' xè divisibile per 3'. Quindi P(A|B)equivale a "dato che sappiamo che xè divisibile per 3 qual è la probabilità che sia (anche) divisibile per 7?". O equivalentemente "Quale frazione dei numeri 3, 6, ..., 99 sono divisibili per 7"?


0

Penso che la tua affermazione iniziale possa essere un malinteso.

Hai scritto:

La formula per la probabilità condizionale di accadere A, una volta che B è avvenuta è:

Dal tuo fraseggio, può sembrare che ci siano 2 eventi "Prima B avvenuta, e quindi vogliamo calcolare la probabilità che A accada".

Questo non è il caso. (Quanto segue è valido sia che ci sia stato un malinteso o meno).

Abbiamo solo 1 evento, che è descritto da una delle 4 possibilità:

  1. né né ;AB

  2. solo , non ;AB

  3. solo , non ;BA

  4. sia che .AB

Inserendo alcuni numeri di esempio, diciamo

P(A)=0.5,P(B)=0.5,andA and B are independent.

Ne consegue che

P(A and B)=0.25andP(neither A nor B)=0.25.

Inizialmente (senza alcuna conoscenza dell'evento), sapevamo che .P(AB)=0.25

Ma una volta che sappiamo che è successo, ci troviamo in uno spazio diverso. è la metà di quindi la probabilità di dato , , è . Non è , sapendo che è successo .P ( AB ) P ( B ) A B P ( ABP(AB)P(B)AB 0,5 0,25 BP(A|B)0.50.25B


0

La probabilità di condizionamento NON è uguale alla probabilità di intersezione. Ecco una risposta intuitiva:

1) : "Sappiamo che successo. Qual è la probabilità che accada?"P(BA)AB

2: : "Non sappiamo se o sono accaduti. Qual è la probabilità che accadranno entrambi?P(AB)AB

La differenza è che nella prima abbiamo informazioni extra (sappiamo che verifica per prima). Nel secondo non sappiamo nulla.A

Partendo dalla probabilità del secondo, possiamo dedurre la probabilità del primo.

L'evento in cui si verificano sia che può avvenire in due modi:AB

1) La probabilità di E la probabilità di dato che successo.ABA

2) La probabilità di E la probabilità di dato che successo.BAB

Si scopre che entrambe le situazioni sono ugualmente accadere. (Non riesco a scoprire il motivo intuitivo). Quindi dobbiamo ponderare entrambi gli scenari con0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

Ora usa e sono indipendenti e ricorda che entrambi gli scenari hanno la stessa probabilità di accadere.ABA

P(AB)=P(A)P(BA)

Tadaaa ... ora isola la probabilità del condizionamento!

btw. Mi piacerebbe se qualcuno potesse spiegare perché gli scenari 1 e 2 sono uguali. La chiave sta lì dentro.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.