Esempi di errata applicazione del teorema di Bayes


11

Questa domanda della comunità di Overflow di matematica ha chiesto "esempi di argomenti sbagliati che comportano l'applicazione di teoremi matematici in contesti non matematici" e ha prodotto un affascinante elenco di matematica applicata patologicamente.

Mi chiedo esempi simili di usi patologici dell'inferenza bayesiana. Qualcuno ha incontrato articoli accademici, post di blog eccentrici che usano i metodi bayesiani in modo irritabile.

Risposte:


3

Sì. Recentemente sono stato assunto come consulente statistico per esaminare un articolo (molto terribile) particolare i cui autori sono riusciti a apparire ancora peggiori in una lettera all'editore usando il teorema di Bayes. Hanno iniziato con un valore predittivo positivo erroneamente calcolato dal loro articolo (PPV = 95% presumibilmente). Fondamentalmente hanno ignorato una lettera critica a riguardo di Ricci (2004) che ha cercato (e fallito) di dire loro come avrebbero dovuto calcolarlo (ha suggerito l'82,3%). Quindi hanno trovato un libro di testo sui biostati (Elston & Johnson, 1994) e lo hanno citato male. Abbiamo comprato il libro e verificato, ma a posteriori, questo era inutile quanto sospettavo. Ottieni un sacco di questo casino (dalla lettera di risposta di Barsness et al. All'editore):

P=P(S/D1)P(S/D1)+P(S/D2)
[p=95/(95+1.6)]

Vedi qualcosa di strano coerente qui? Di sicuro non ...

  1. Questo è il teorema di Bayes mentre Elston e Johnson (1994) lo applicano ad un esempio di ereditarietà dell'emofilia:

    P(D1|S)=P(D1)P(S|D1)P(D1)P(S|D1)+P(D2)P(S|D2)

    Le discrepanze parlano da sole, ma ecco una citazione dalla loro discussione sull'esempio:

    Il fatto di avere un figlio inalterato diminuisce la probabilità di ereditare il gene dell'emofilia, e quindi la probabilità che il suo secondo figlio ne risenta.

    Laddove Barsness e colleghi hanno avuto l'idea che la bassa prevalenza rafforza il PPV, non lo so, ma sicuramente non stavano prestando attenzione al proprio libro di testo preferito.

  2. Non sembrano capire che la PPV è la probabilità di un "evento reale" (D 1 ) data una frattura costale (S). Pertanto, in una dimostrazione poeticamente completa di " immondizia, immondizia in uscita ", inseriscono il loro PPV come numeratore e denominatore, aggiungono la prevalenza al denominatore e ottengono un PPV più elevato. È un peccato che non si siano resi conto di poter continuare in modo circolare fino alla nausea : Sebbene 98.4 sia effettivamente ; cioè, qualsiasi PPV potrebbe essere convertito in 98.4 con prevalenza = 1.6 se la loro versione dell'equazione fosse corretta applicandola in modo iterativo.

    p1=95/(95+1.6)=98.3p2=98.3/(98.3+1.6)=98.4
    limkpk(pk1,1.6)
  3. Quando si usano le loro informazioni sulla prevalenza e alcune stime ragionevoli di sensibilità e specificità da altri studi sull'argomento, il PPV risulta essere molto più basso (forse fino al 3%). La cosa divertente è che non avrei nemmeno pensato di usare il teorema di Bayes se non avessero cercato di usarlo per rafforzare il loro caso. Chiaramente non funzionerà in quel modo data una prevalenza dell'1,6%.


Riferimenti
· Barsness, KA, Cha, ES, Bensard, DD, Calkins, CM, Partrick, DA, Karrer, FM, & Strain, JD (2003). Il valore predittivo positivo delle fratture costali come indicatore del trauma non accidentale nei bambini. Journal of Trauma-Injury, Infezione e Critical Care, 54 (6), 1107-1110.
· Elston, RC e Johnson, WD (1994). Elementi essenziali di biostatistica (2a edizione). Filadelfia: FA Davis Company.
· Ricci, LR (2004). Lettera all'editore. Journal of Trauma-Injury, Infezione e Critical Care, 56 (3), 721.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.