Pool di grafici di calibrazione dopo imputazione multipla


15

Vorrei un consiglio su come raggruppare i grafici / i grafici di calibrazione dopo un'imputazione multipla. Nel contesto dello sviluppo di modelli statistici al fine di prevedere un evento futuro (ad es. Utilizzando i dati dei registri ospedalieri per prevedere la sopravvivenza o gli eventi post dimissione dall'ospedale), si può immaginare che ci siano alcune o molte informazioni mancanti. L'imputazione multipla è un modo di gestire una situazione del genere, ma comporta la necessità di mettere in comune le statistiche dei test di ciascun set di dati di imputazione tenendo conto della variabilità aggiuntiva dovuta all'incertezza intrinseca dell'imputazione.

Capisco che ci sono più statistiche di calibrazione (hosmer-lemeshow, Emax di Harrell, indice di calibrazione stimato, ecc.), Per le quali potrebbero essere applicate le regole 'regolari' di Rubin per il pooling.

Tuttavia, queste statistiche sono spesso misure generali di calibrazione che non mostrano regioni specifiche del modello con calibrazione errata. Per questo motivo, preferirei guardare un diagramma di calibrazione. Purtroppo, non ho idea di come "raggruppare" i grafici o i dati dietro di essi (probabilità prevista per individuo e risultato osservato per individuo), e non riesco a trovare molto nella letteratura biomedica (il campo che conosco), o qui, su CrossValidated. Ovviamente, esaminare il diagramma di calibrazione di ciascun set di dati di imputazione potrebbe essere una risposta, ma potrebbe diventare piuttosto fastidioso (ad oggi) quando vengono creati molti set di imputazioni.

Vorrei quindi chiedere se esistono tecniche che potrebbero tradursi in un diagramma di calibrazione, raggruppato dopo imputazione multipla (?)


È possibile raggruppare direttamente i campioni avviati e valutare la calibrazione di quel campione?
AdamO,

@AdamO cosa intendi esattamente per pooling diretto? E a quali esempi di bootstrap ti riferisci?
IWS,

2
Scusa, fammi tornare indietro, (penso a MI come a un bootstrap). Sto dicendo, se il tuo n è 1.000 e hai 5 set di dati MI, perché non creare un singolo diagramma di calibrazione dal 5000 e confrontare osservati / previsti nella maniera desiderata in quei 5.000?
AdamO,

@AdamO Sembra interessante, richiederebbe una regolazione delle funzioni che forniscono anche un intervallo di confidenza. Qualche riferimento o teoria a sostegno di questa idea?
IWS,

2
Nessun riferimento, abbiamo recentemente pubblicato un articolo in cui abbiamo affermato senza prove che abbiamo ottenuto inferenza per errori standard bootstrap e imputazione multipla riunendoli in questo modo. Penso che si possa affermare che lo scopo dell'analisi è testare a livello 0,05 che il rapporto aspettativa / osservazione o la differenza è all'interno di un normale intervallo distributivo e che le stime quantili sono invarianti rispetto alle dimensioni del campione, quindi test basati sull'IC al 95% non è influenzato dal pooling.
AdamO

Risposte:


1

[...] se il tuo n è 1.000 e hai 5 set di dati MI, perché non creare un singolo diagramma di calibrazione dal 5000 e confrontare le osservazioni osservate / attese nel modo desiderato in quelle 5.000?

Per quanto riguarda i riferimenti:

Nessun riferimento, abbiamo recentemente pubblicato un articolo in cui abbiamo affermato senza prove che abbiamo ottenuto inferenza per errori standard bootstrap e imputazione multipla riunendoli in questo modo. Penso che si possa affermare che lo scopo dell'analisi è testare a livello 0,05 che il rapporto aspettativa / osservazione o la differenza è all'interno di un normale intervallo distributivo e che le stime quantili sono invarianti rispetto alla dimensione del campione, quindi test basati sull'IC al 95% non è influenzato dal pooling.


1
Ho copiato questo commento di @AdamO come una risposta wiki della comunità perché il commento è, più o meno, una risposta a questa domanda. Abbiamo un divario drammatico tra risposte e domande. Almeno una parte del problema è che ad alcune domande viene data risposta nei commenti: se invece i commenti che hanno risposto alla domanda fossero risposte, avremmo meno domande senza risposta.
mkt - Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.