Vorrei un consiglio su come raggruppare i grafici / i grafici di calibrazione dopo un'imputazione multipla. Nel contesto dello sviluppo di modelli statistici al fine di prevedere un evento futuro (ad es. Utilizzando i dati dei registri ospedalieri per prevedere la sopravvivenza o gli eventi post dimissione dall'ospedale), si può immaginare che ci siano alcune o molte informazioni mancanti. L'imputazione multipla è un modo di gestire una situazione del genere, ma comporta la necessità di mettere in comune le statistiche dei test di ciascun set di dati di imputazione tenendo conto della variabilità aggiuntiva dovuta all'incertezza intrinseca dell'imputazione.
Capisco che ci sono più statistiche di calibrazione (hosmer-lemeshow, Emax di Harrell, indice di calibrazione stimato, ecc.), Per le quali potrebbero essere applicate le regole 'regolari' di Rubin per il pooling.
Tuttavia, queste statistiche sono spesso misure generali di calibrazione che non mostrano regioni specifiche del modello con calibrazione errata. Per questo motivo, preferirei guardare un diagramma di calibrazione. Purtroppo, non ho idea di come "raggruppare" i grafici o i dati dietro di essi (probabilità prevista per individuo e risultato osservato per individuo), e non riesco a trovare molto nella letteratura biomedica (il campo che conosco), o qui, su CrossValidated. Ovviamente, esaminare il diagramma di calibrazione di ciascun set di dati di imputazione potrebbe essere una risposta, ma potrebbe diventare piuttosto fastidioso (ad oggi) quando vengono creati molti set di imputazioni.
Vorrei quindi chiedere se esistono tecniche che potrebbero tradursi in un diagramma di calibrazione, raggruppato dopo imputazione multipla (?)