Se "B è più probabile con A", allora "A è più probabile con B"


9

Sto cercando di ottenere un'intuizione più chiara dietro: "Se rende più probabile, allora rende più probabile"UNBBUN

Sia la dimensione dello spazio in cui e sono, quindin(S)UNB

Reclamo: quindiP(B|UN)>P(B)n(UNB)/n(UN)>n(B)/n(S)

quindin(UNB)/n(B)>n(UN)/n(S)

che èP(UN|B)>P(UN)

Capisco la matematica, ma perché questo ha un senso intuitivo?


1
Ho modificato la domanda per rimuovere la parola "make". Questa domanda sembrava un po 'come quelle domande ambigue su Facebook, quelle in cui devi risolvere una somma algebrica con immagini e le persone ottengono risposte molto diverse a causa delle diverse interpretazioni della domanda. Non è qualcosa che vogliamo qui. (un'alternativa è quella di chiudere la domanda per essere poco chiari e far cambiare l'OP).
Sesto Empirico

Risposte:


10

A titolo di intuizione, esempi del mondo reale come quelli di Peter Flom sono molto utili per alcune persone. L'altra cosa che comunemente aiuta le persone sono le immagini. Quindi, per coprire la maggior parte delle basi, facciamo alcune foto.

Diagramma di probabilità condizionale che mostra l'indipendenza Diagramma di probabilità condizionale che mostra la dipendenza

Quello che abbiamo qui sono due diagrammi di base che mostrano le probabilità. Il primo mostra due predicati indipendenti che chiamerò Red e Plain. È chiaro che sono indipendenti perché le linee si allineano. La proporzione dell'area piana che è rossa è uguale alla proporzione dell'area a strisce che è rossa ed è uguale alla proporzione totale che è rossa.

Nella seconda immagine, abbiamo distribuzioni non indipendenti. In particolare, abbiamo ampliato parte della semplice area rossa nell'area a strisce senza modificare il fatto che sia rossa. Chiaramente, quindi, essere rossi rende la probabilità più chiara.

Nel frattempo, dai un'occhiata al lato semplice di quell'immagine. Chiaramente la proporzione della regione normale che è rossa è maggiore della proporzione dell'intera immagine che è rossa. Questo perché alla semplice regione è stata assegnata un'area più ampia e tutta è rossa.

Quindi, il rosso rende più probabile la pianura e il rosso rende più probabile.

Cosa sta realmente succedendo qui? A è la prova di B (ovvero, A rende B più probabile) quando l'area che contiene sia A che B è più grande di quanto sarebbe previsto se fossero indipendenti. Poiché l'intersezione tra A e B è uguale all'intersezione tra B e A, ciò implica anche che B è la prova di A.

Una nota di cautela: anche se l'argomento sopra sembra molto simmetrico, potrebbe non essere il caso che la forza dell'evidenza in entrambe le direzioni sia uguale. Ad esempio, considera questa terza immagine. Qui è successa la stessa cosa: il rosso normale ha divorato il territorio in precedenza appartenente al rosso a strisce. In effetti, ha completamente finito il lavoro!Diagramma di probabilità condizionale che mostra estrema dipendenza

Si noti che il punto essendo rosso garantisce la chiarezza perché non ci sono regioni rosse a strisce. Tuttavia, un punto chiaro non ha garantito il rossore, perché rimangono ancora regioni verdi. Ciononostante, un punto nella casella aumenta la probabilità che sia rosso e un punto rosso aumenta la probabilità che sia normale. Entrambe le direzioni implicano una maggiore probabilità, ma non della stessa quantità.


Mi piacciono le immagini :) Tuttavia sembra che le immagini o la spiegazione siano capovolte: In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. - la tua seconda immagine ha guadagnato un'area normale rispetto alla prima, quindi passando dall'immagine 1 a 2 abbiamo spostato l'area normale nell'area a strisce.
Pod

Quindi, se ho un diagramma di Venn con alcune aree comuni di intersezione A, B e tutto ciò che faccio è aumentare l'area di intersezione, aggiungo automaticamente più A, B per l'intero spazio (senza allargare lo spazio) e cambiare / aumentare n (A ) / n (S) e n (B) / n (S) di conseguenza. Giusto? Altri commenti?
Rahul Deora,

4
Il rosso contro il verde è una combinazione problematica per i non vedenti.
Richard Hardy,

@Pod Penso che sia un'ambiguità del linguaggio naturale che stai descrivendo. Leggi "abbiamo spostato parte dell'area rossa a strisce nell'area piana" in quanto "abbiamo spostato parte dell'area precedentemente nota come rosso a strisce e l'abbiamo cambiata nell'area piana". Penso che tu lo abbia [erroneamente] letto come "abbiamo ampliato parte dell'area a strisce rosse nell'area precedentemente nota come semplice" .
Peter - Ripristina Monica il

20

Penso che un altro modo matematico per dirlo possa aiutare. Considera l'affermazione nel contesto della regola di Bayes:

Reclamo: se P(B|A)>P(B) quindi P(A|B)>P(A)

Regola di Bayes:

P(AB)=P(BA)P(A)P(B)

assumendo P(B) diverso da zero. così

P(A|B)P(A)=P(B|A)P(B)

Se P(B|A)>P(B) , quindi P(B|A)P(B)>1.

Quindi P(A|B)P(A)>1, e quindiP(A|B)>P(A).

Ciò dimostra l'affermazione e una conclusione ancora più forte - che le rispettive proporzioni delle probabilità devono essere uguali.


Mi è piaciuto questo perché mostra il legame più forte "se A fa B x per cento più probabilità, allora B fa un x per cento più probabilità"
probabilityislogic

@probabilityislogic La frase in questo modo introduce ambiguità. Se la probabilità precedente è del 10% e quella posteriore è del 15%, la probabilità è aumentata del 5% (15% meno 10%) o del 50% (15% diviso per il 10%)?
Accumulo

Una dimostrazione più semplice: se , quindi usando quella e la regola di Bayes, abbiamo P ( A | B ) = P ( B | A ) P ( A ) / P ( B ) > P ( B ) P ( A ) / P ( B ) = P ( A )P(B|A)>P(B)P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)
Raggio

12

Bene, non mi piace la parola "fa" nella domanda. Ciò implica una sorta di causalità e la causalità di solito non si inverte.

Ma hai chiesto intuizione. Quindi, vorrei pensare ad alcuni esempi, perché sembra suscitare intuizione. Scegli quello che ti piace:

Se una persona è una donna, è più probabile che abbia votato per un democratico.
Se una persona ha votato per un democratico, è più probabile che sia una donna.

Se un uomo è un centro di pallacanestro professionista, è più probabile che sia alto più di 2 metri.
Se un uomo è alto più di 2 metri, è più probabile che sia un centro di pallacanestro.

Se supera i 40 gradi Celsius, è più probabile che si verifichi un blackout.
Se si è verificato un blackout, è più probabile che superi i 40 gradi.

E così via.


4
Non si tratta di probabilità. Sono circa 1 a 1 relazioni.
Peter Flom

6
@jww Immagina la frase "se piove, la strada è bagnata" (e supponiamo che sia una valida implicazione per il momento, mentre il contrario non lo è). Ora prendi un gran numero di "campioni" in tempi e luoghi diversi, in cui annoti se piove e se la strada è bagnata. La strada sarà bagnata in più campioni in cui piove rispetto ai campioni in cui non è; ma anche , sarà piove in più dei campioni dove la strada è bagnata rispetto ai campioni in cui la strada è asciutta. Questa è probabilità.
Hobbs

3
Entrambi i fenomeni sono causati dalla stessa implicazione; l'implicazione funziona solo in un modo, ma osservare il conseguente rende più probabile che tu stia guardando un campione in cui l'antecedente è vero.
Hobbs

7
@Barmar Siamo spiacenti, ma ciò dimostra in parte la correttezza della mia logica. Perché dire 36 / 25.000 è molto più alto di 1 / 150.000.000.
Peter Flom

7
Più probabile di qualcuno che è alto meno di 2 metri.
Peter Flom

9

Per aggiungere la risposta di @Dasherman: cosa può significare dire che due eventi sono correlati , o forse associati o correlati ? Forse potremmo per una definizione confrontare la probabilità congiunta (Supponendo P(A)>0,P(B)>0 ):

η(A,B)=P(AB)P(A)P(B)
quindi seηè maggiore di uno,AeBpresentano insieme più spesso che in stato di indipendenza. Quindi possiamo dire cheAeBsono positivamente correlati.

Ma ora, usando la definizione di probabilità condizionale, P(AB)P(A)P(B)>1è una facile conseguenza diP(BA)>P(B). MaP(AB)P(A)P(B)è completamente simmetrico inAeB(scambiando tutte le occorrenze del simboloAconBe viceversa) lascia le stesse formule, quindi è anche equivalente aP(AB)>P(A). Questo dà il risultato. Così l'intuizione si chiede è cheη(A,B)è simmetrica inAeB.

La risposta di @gunes ha fornito un esempio pratico ed è facile rendere gli altri allo stesso modo.


2

Se A rende B più probabile, ciò significa che gli eventi sono in qualche modo correlati. Questa relazione funziona in entrambi i modi.

Se A rende B più probabile, ciò significa che A e B tendono ad accadere insieme. Ciò significa quindi che B rende anche A più probabile.


1
Questo forse potrebbe usare un po 'di espansione? Senza una definizione di correlata è un po 'vuota.
mdewey,

2
Stavo cercando di stare lontano da qualsiasi cosa rigorosa, poiché OP ha chiesto una spiegazione intuitiva. Hai ragione, è abbastanza vuoto come lo è ora, ma non sono sicuro di come espanderlo in modo intuitivo. Ho aggiunto un tentativo.
Dasherman,

2

Se A rende B più probabile, A ha informazioni cruciali che B può dedurre da sé. Nonostante il fatto che potrebbe non contribuire con lo stesso importo, le informazioni non vanno perse al contrario. Alla fine, abbiamo due eventi che la loro occorrenza si supporta l'un l'altro. Non riesco a immaginare uno scenario in cui il verificarsi di A aumenta la probabilità di B e il verificarsi di B diminuisce la probabilità di A. Ad esempio, se piove, il pavimento sarà bagnato con alta probabilità e se il pavimento è bagnato, non significa che ha piovuto ma non diminuisce le possibilità.


2

Puoi rendere la matematica più intuitiva immaginando una tabella di contingenza.

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • Quando A e B sono indipendenti, le probabilità congiunte sono prodotti delle probabilità marginali

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    P(A)=P(A|B)P(B)=P(B|A)

  • a,b,c,d±z

    A¬A1x1xBya+zbz¬B1yczd+z

    z

    P(A|B)P(A)P(B|A)P(B)>z<z

P(A|B)>P(A)P(B|A)>P(B)P(B,A)>P(A)P(B)

Se A e B si verificano spesso insieme (la probabilità congiunta è maggiore del prodotto delle probabilità marginali), osservando l'una aumenterà la probabilità (condizionale) dell'altra.


2

Supponiamo di indicare il rapporto di probabilità da posteriore a precedente di un evento come:

Δ(A|B)P(A|B)P(A)

Quindi un'espressione alternativa del teorema di Bayes (vedi questo post correlato ) è:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

BAAB


ABdo


1

Ti viene detto che Sam è una donna e Kim è un uomo, e uno dei due si trucca e l'altro no. Chi di loro indovineresti a truccarsi?

Ti viene detto che Sam si trucca e Kim no, e uno dei due è un uomo e uno è una donna. Chi indovineresti è la donna?


Non è così semplice collegarlo al problema originale. Che cos'è esattamente l'evento A e cos'è l'evento B? Qui sembra più un paragone delle probabilità. L'evento A è 'x is a women' (non A è l'evento 'x is a man'). E l'evento B è 'x indossa il trucco'. Ma ora abbiamo improvvisamente un Sam e un Kim, da dove proviene e dovremmo usare qualcosa di informazioni sulla mascolinità soggettiva o la femminilità dei loro nomi?
Sesto Empirico

1

Sembra che ci sia un po 'di confusione tra causalità e correlazione. In effetti, la dichiarazione della domanda è falsa per causalità, come si può vedere da un esempio come:

  • Se un cane indossa una sciarpa, allora è un animale domestico.

Quanto segue non è vero:

  • Vedere un animale domestico che indossa una sciarpa implica che è un cane.
  • Vedere un cane addomesticato implica che indossa una sciarpa.

Tuttavia, se stai pensando alle probabilità (correlazione), allora È vero:

  • I cani che indossano sciarpe hanno molte più probabilità di essere un animale domestico rispetto ai cani che non indossano sciarpe (o animali in generale per quella materia)

È vero quanto segue:

  • Un animale domestico che indossa una sciarpa ha maggiori probabilità di essere un cane rispetto a un altro animale.
  • Un cane domestico ha maggiori probabilità di indossare una sciarpa rispetto a un cane non domestico.

Se questo non è intuitivo, pensa a un pool di animali tra formiche, cani e gatti. Cani e gatti possono entrambi essere addomesticati e indossare sciarpe, le formiche non possono nemmeno.

  1. Se aumenti la probabilità di animali domestici nella tua piscina, significa anche che aumenterai la possibilità di vedere un animale che indossa una sciarpa.
  2. Se aumenti la probabilità di gatti o cani, aumenterai anche la probabilità di vedere un animale che indossa una sciarpa.

Essere addomesticati è il legame "segreto" tra l'animale e indossare una sciarpa, e quel legame "segreto" eserciterà la sua influenza in entrambi i modi.

Modifica: dai un esempio alla tua domanda nei commenti:

Immagina un mondo in cui gli animali sono Cats o Dogs. Possono essere addomesticati o meno. Possono indossare una sciarpa o no. Immagina che esistano 100 animali in totale, 50 cani e 50 gatti.

Ora considera l'affermazione A come: "I cani che indossano sciarpe hanno tre volte più probabilità di essere un animale domestico rispetto ai cani che non indossano sciarpe ".

Se A non è vero, allora puoi immaginare che il mondo potrebbe essere composto da 50 cani, 25 dei quali addomesticati (di cui 10 indossano sciarpe), 25 dei quali selvaggi (di cui 10 indossano sciarpe). Stesse statistiche per i gatti.

Quindi, se vedessi un animale domestico in questo mondo, avrebbe il 50% di probabilità di essere un cane (25/50, 25 cani su 50 animali domestici) e il 40% di possibilità di avere una sciarpa (20/50, 10 cani e 10 gatti su 50 animali domestici).

Tuttavia, se A è vero, allora hai un mondo in cui ci sono 50 cani, 25 dei quali addomesticati (di cui 15 indossano sciarpe ), 25 dei quali selvaggi (di cui 5 indossano sciarpe ). I gatti mantengono le vecchie statistiche: 50 gatti, 25 dei quali addomesticati (di cui 10 indossano sciarpe), 25 dei quali selvatici (di cui 10 indossano sciarpe).

Quindi, se vedessi un animale domestico in questo mondo, avrebbe la stessa probabilità del 50% di essere un cane (25/50, 25 cani su 50 animali domestici) ma avrebbe il 50% (25/50, 15 cani e 10 gatti su 50 animali domestici).

Come puoi vedere, se dici che A è vero, allora se vedessi un animale domestico indossare una sciarpa nel mondo, sarebbe più probabile un Cane (60% o 15/25) rispetto a qualsiasi altro animale (in questo caso Gatto, 40% o 10/25).


Questa è la linea con cui ho un problema: "Un animale domestico che indossa una sciarpa ha maggiori probabilità di essere un cane rispetto a un altro animale". Quando abbiamo fatto la nostra dichiarazione iniziale, non abbiamo fatto alcuna affermazione sugli altri animali che potrebbero indossare sciarpe. Potrebbero essere 100. Abbiamo fatto solo una dichiarazione sui cani.
Rahul Deora,

Verifica se la mia modifica aiuta a risolvere il tuo problema specifico.
H4uZ,

0

C'è una confusione qui tra causalità e correlazione. Quindi ti darò un esempio in cui accade l'esatto contrario.

Alcune persone sono ricche, altre sono povere. Alcune persone povere ricevono benefici, il che le rende meno povere. Ma le persone che ottengono benefici hanno ancora maggiori probabilità di essere povere, anche con benefici.

Se ti vengono dati dei benefici, è più probabile che tu possa permetterti i biglietti per il cinema. ("Rende più probabile" che significa causalità). Ma se puoi permetterti biglietti per il cinema, ciò rende meno probabile che tu sia tra le persone che sono abbastanza povere da ottenere benefici, quindi se puoi permetterti biglietti per il cinema, hai meno probabilità di ottenere benefici.


5
Questa non è una risposta alla domanda. Interessante, ma non una risposta. In effetti, si tratta di uno scenario diverso; la ragione per cui accade il contrario è che sta usando due metriche diverse che sono chiamate in modo simile (scarso senza benefici contro scarso con benefici) e come tale è uno scenario completamente diverso.
wizzwizz4,

0

L'intuizione diventa chiara se guardi alla frase più forte:

Se A implica B, allora B rende A più probabile.

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

Ovviamente A è più probabile che sia vero se B è noto anche per essere vero, perché se B fosse falso allora lo sarebbe anche A. La stessa logica si applica all'istruzione più debole:

Se A rende B più probabile, allora B rende A più probabile.

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true

Penso che quello che stai dicendo nella prima affermazione sia che in un diagramma di Venn se A è contenuto in B, allora se B è vero n (A) / n (B) deve essere maggiore di n (A) / n (S) come B è uno spazio più piccolo di S. Anche nel secondo, dici anche tu?
Rahul Deora,

@RahulDeora - Sì, è così che funziona. La versione debole è molto meno ovvia, ma hai già fatto la matematica comunque. Ciò che hai chiesto è l'intuizione alla base del risultato, che può essere meglio osservata nell'affermazione più forte.
Rainer P.

Un piccolo problema con l'utilizzo di questa affermazione per ottenere un po 'più di intuizione è che non è del tutto vero. "Una B implicita" non è una condizione sufficiente per "quando B allora A è più probabile". La distinzione importante è che con "A che implica B" non è necessario rendere B più probabile. Gli esempi più importanti sono quando B è sempre vero.
Sesto Empirico

0

Supponiamo che Alice abbia una frequenza di lancio libera superiore alla media. Quindi la probabilità che un tiro abbia successo, dato che è tentato da Alice, è maggiore della probabilità che un tiro abbia successo in generaleP(SucceSSful|UNlioce)>P(SucceSSful). Possiamo anche concludere che la quota di tiri di successo di Alice è maggiore della sua quota di tiri in generale:P(UNlioce|SucceSSful)>P(UNlioce).

O supponiamo che ci sia una scuola che ha il 10% degli studenti nel suo distretto scolastico, ma il 15% degli studenti di diritto A. Quindi chiaramente la percentuale di studenti in quella scuola che sono studenti di diritto A è superiore alla percentuale di distretto.

Un altro modo di vederlo: A è più probabile, dato B, se P(UN&B)>P(UN)P(B)e questo è completamente simmetrico rispetto a UN e B.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.