Teorema di Bayes modificato di XKCD: in realtà un po 'ragionevole?


81

So che proviene da un fumetto famoso per aver approfittato di alcune tendenze analitiche , ma in realtà sembra ragionevole dopo alcuni minuti di fissazione. Qualcuno può descrivere per me cosa sta facendo questo " teorema di Bayes modificato "?



50
@Tschallacka Cosa ti fa pensare che Randall l'abbia scritto?
Kasperd,

16
@Tschallacka a meno che uno degli autori non sia lo stesso Randall, non è così.
SQB

Ma non dovresti applicare il teorema di Bayes a P (C) per aggiornarne il valore di fronte a ulteriori prove?
Yakk,

1
Sono abbastanza sicuro che la ci sia solo un'aggiunta facetious. P(C)
Ian MacDonald,

Risposte:


107

Bene, distribuendo il termine , otteniamo che possiamo interpretare come la Legge della probabilità totale applicata all'evento "stai usando correttamente le statistiche bayesiane". Quindi, se si utilizza correttamente statistica bayesiana, poi si recupera la legge di Bayes' (la frazione sinistra sopra) e se non si è, allora si ignorano i dati e basta usare la tua prima su .P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1P(C)],
C=H

Suppongo che questo sia un contraccolpo contro la critica secondo cui, in linea di principio, i bayesiani possono adeguare il precedente per sostenere qualsiasi conclusione desiderino, mentre i bayesiani sostengono che non è così che funzionano le statistiche bayesiane.

(E sì, avete fatto con successo secchione-snipe me. Non sono né un matematico né un fisico, però, quindi non sono sicuro di quanti punti valgo.)


60
Una battuta intelligente incorporata nella formula sopra è che se non stai usando correttamente le statistiche bayesiane, la tua deduzione è completamente indipendente dalla verità.
Cliff AB,

25
Spero che tu non abbia scritto la tua risposta mentre attraversi una strada trafficata. Non farò parte di questo ...
eric_kernfeld,

6
Il tipo di bayesiani sopra menzionati non è statistico bayesiano, sono avvocati bayesiani
kjetil b halvorsen,

4
@CliffAB Non so se lo definirei uno scherzo intelligente o una legge della natura.
eric_kernfeld,

7
@CLiffAB Intendi "Il tuo posteriore (come calcolato da questa formula) è indipendente dalle prove"?
Accumulo

31

Che ci crediate o no, questo tipo di modello si presenta di tanto in tanto in modelli statistici molto seri, specialmente quando si tratta di fusione dei dati, cioè cercando di combinare l'inferenza da più sensori cercando di fare l'inferenza su un singolo evento.

Se un sensore funziona male, può distorcere notevolmente l'inferenza fatta quando si cerca di combinare i segnali da più fonti. È possibile rendere un modello più solido a questo problema includendo una piccola probabilità che il sensore stia semplicemente trasmettendo valori casuali, indipendentemente dall'effettivo evento di interesse. Ciò ha come risultato che se 90 sensori indicano debolmente è vero, ma 1 sensore indica fortemente che è vero, dovremmo comunque concludere cheABAè vero (vale a dire, la probabilità posteriore che questo sensore si accenda in modo errato diventa molto alta quando ci rendiamo conto che contraddice tutti gli altri sensori). Se la distribuzione dei guasti è indipendente dal parametro su cui vogliamo dedurre, allora se la probabilità posteriore che si tratti di un guasto è alta, le misure di quel sensore hanno un effetto molto scarso sulla distribuzione posteriore per il parametro di interesse; in effetti, l'indipendenza se la probabilità posteriore di fallimento è 1.

È questo un modello generale che dovrebbe essere preso in considerazione quando si tratta di inferenza, cioè dovremmo sostituire il teorema di Bayes con il teorema di Bayes modificato quando facciamo statistiche bayesiane? No. Il motivo è che "usare correttamente le statistiche bayesiane" non è solo binario (o, se lo è, è sempre falso). Qualsiasi analisi avrà gradi di ipotesi errate. Affinché le tue conclusioni siano completamente indipendenti dai dati (che è implicito nella formula), devi fare errori estremamente gravi. Se "utilizzare erroneamente le statistiche bayesiane" a qualsiasi livello significasse che la tua analisi fosse completamente indipendente dalla verità, l'uso delle statistiche sarebbe del tutto inutile. Tutti i modelli sono sbagliati ma alcuni sono utili e tutto il resto.


5
Immagino che siamo stati fortunati a scoprire che la modalità di guasto statico dei nostri sensori è un estremo o l'altro. La compressione del rumore è molto più difficile però. È davvero fastidioso scoprire che il sensore funziona correttamente e il valore ricevuto è errato perché il filo si comporta come un'antenna.
Giosuè,

@Joshua speriamo che un giorno avrò il tempo di imparare correttamente il filtraggio di Kalman per quel tipo di situazioni (o forse qualcuno scriverà una brillante risposta SE che chiarisce tutto?).
mbrig

@Joshua: credo che tu stia pensando a un modello molto più specifico di me. Sebbene una buona caratterizzazione della distribuzione degli errori possa migliorare l'inferenza, questi possono essere ancora molto utili nel caso di distribuzioni degli errori molto vaghe. Ad esempio, supponiamo di voler fare inferenze su un parametro e sensore misura è se funziona. Potremmo includere una piccola probabilità che sia, diciamo in caso di fallimento. Se il sensore non è pienamente d'accordo con tutti gli altri sensori, la probabilità posteriore che si tratti di un guasto diventa molto alta. μiN(aiμ,1)t(df=10)i
Cliff AB,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.