Cosa sono i controlli predittivi posteriori e cosa li rende utili?


33

Capisco qual è la distribuzione predittiva posteriore e ho letto dei controlli predittivi posteriori , anche se non mi è ancora chiaro cosa faccia.

  1. Che cos'è esattamente il controllo predittivo posteriore?
  2. Perché alcuni autori affermano che eseguire controlli predittivi posteriori sta "utilizzando i dati due volte" e non dovrebbero essere abusati? (o anche che non è bayesiano)? (es. vedere questo o questo )
  3. A cosa serve esattamente questo controllo? Può davvero essere utilizzato per la selezione del modello? (ad es. tiene conto sia della forma fisica che della complessità del modello?)

Risposte:


36

Controlli predittivi posteriori sono, in parole semplici, "simulare i dati replicati con il modello adattato e poi confrontarli con i dati osservati" ( Gelman e Hill, 2007, p. 158 ). Quindi, usi il predittivo posteriore per "cercare discrepanze sistematiche tra dati reali e simulati" ( Gelman et al. 2004, p. 169 ).

L'argomento su "usare i dati due volte" è che usi i tuoi dati per stimare il modello e poi, per verificare se il modello si adatta ai dati, mentre generalmente è una cattiva idea e sarebbe meglio convalidare il tuo modello su dati esterni , che non è stato utilizzato per la stima.

Controlli predittivi posteriori sono utili per valutare se il tuo modello ti fornisce previsioni "valide" sulla realtà - si adattano o meno ai dati osservati. È una fase utile per la costruzione e il controllo dei modelli. Non ti dà una risposta definitiva se il tuo modello è "ok" o se è "migliore" rispetto ad altri modelli, tuttavia, può aiutarti a verificare se il tuo modello ha senso.

Questo è ben descritto in LaplacesDemon vignette Bayesian Inference :

yrappresentantey

I controlli predittivi posteriori (tramite la distribuzione predittiva) comportano un doppio uso dei dati, il che viola il principio di probabilità. Tuttavia, sono state avanzate argomentazioni a favore dei controlli predittivi posteriori, a condizione che l'uso sia limitato a misure di discrepanza per studiare l'adeguatezza del modello, non per il confronto e l'inferenza del modello (Meng 1994).

yrappresentanteyyyrappresentante


3
a proposito del fatto che i PPC potrebbero non essere bayesiani, nota che Gelman discute molto su cosa esattamente un'analisi dei dati bayesiana / bayesiana sia Gelman e Shalizi
N Brouwer,

2
Gelman e Shalizi discutono dell'analisi dei dati bayesiani secondo il loro punto di vista. Esistono molti punti di vista diversi, tutti ben motivati: da Jeffreys a Savage, da De Finetti a Gaifman, Scott & Krauss e Hailperin , per non parlare di punti di vista che differiscono ancora di più, come quello di Dempster-Shafer .
pglpm,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.