Mi riferisco a questo documento: Hayes JR, Groner JI. "Utilizzo di punteggi multipli di imputazione e propensione per testare l'effetto dei seggiolini auto e dell'utilizzo delle cinture di sicurezza sulla gravità delle lesioni dai dati del registro dei traumi." J Pediatr Surg. Maggio 2008; 43 (5): 924-7.
In questo studio, è stata eseguita un'imputazione multipla per ottenere 15 set di dati completi. I punteggi di propensione sono stati quindi calcolati per ciascun set di dati. Quindi, per ciascuna unità osservativa, è stato scelto casualmente un record da uno dei 15 set di dati completati (incluso il relativo punteggio di propensione) creando così un singolo set di dati finale per il quale è stato quindi analizzato mediante corrispondenza del punteggio di propensione.
Le mie domande sono: questo è un modo valido per eseguire la corrispondenza del punteggio di propensione dopo un'imputazione multipla? Ci sono modi alternativi per farlo?
Per il contesto: nel mio nuovo progetto, ho l'obiettivo di confrontare gli effetti di 2 metodi di trattamento utilizzando la corrispondenza del punteggio di propensione. Mancano dati e intendo utilizzare il MICE
pacchetto in R per imputare i valori mancanti, quindi twang
fare la corrispondenza del punteggio di propensione e quindi lme4
analizzare i dati corrispondenti.
Update1:
Ho trovato questo documento che ha un approccio diverso: Mitra, Robin e Reiter, Jerome P. (2011) Punteggio di propensione che corrisponde a covariate mancanti tramite imputazione multipla sequenziale iterata [Working Paper]
In questo articolo gli autori calcolano i punteggi di propensione su tutti i set di dati imputati e poi li raggruppano facendo una media, che è nello spirito dell'imputazione multipla usando le regole di Rubin per una stima puntuale - ma è davvero applicabile per un punteggio di propensione?
Sarebbe davvero bello se qualcuno su CV potesse fornire una risposta con un commento su questi 2 diversi approcci e / o qualsiasi altro ...