Intervallo di confidenza per l'effetto medio del trattamento basato sulla ponderazione del punteggio di propensione?


9

Sto cercando di stimare l'effetto medio del trattamento dai dati osservazionali usando la ponderazione del punteggio di propensione (in particolare IPTW). Penso di calcolare correttamente l'ATE, ma non so come calcolare l'intervallo di confidenza dell'ATE tenendo conto dei pesi inversi del punteggio di propensione.

Ecco l'equazione che sto usando per calcolare l'effetto del trattamento medio (riferimento Stat Med. 10 set 2010; 29 (20): 2137–2148.): Dove numero totale di soggetti, stato del trattamento, stato del risultato e punteggio di propensione.

ATE=1N1NZiYipi1N1N(1Zi)Yi1pi
N=Zi=Yi=pi=

Qualcuno sa di un pacchetto R che calcolerebbe l'intervallo di confidenza dell'effetto medio del trattamento, tenendo conto dei pesi? Il surveypacchetto potrebbe aiutare qui? Mi chiedevo se avrebbe funzionato:

library(survey)
sampsvy=svydesign(id=~1,weights=~iptw,data=df)
svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta')

#which produces this result:
  treatment surgery == "lump"      ci_l      ci_u
   No         0.1644043 0.1480568 0.1817876
   Yes         0.2433215 0.2262039 0.2610724

Non so dove andare da qui per trovare l'intervallo di confidenza della differenza tra le proporzioni (cioè l'effetto di trattamento medio).


Non posso rispondere in modo specifico, ma il libro "Sondaggi complessi: una guida all'analisi che utilizza R" dell'autore del pacchetto di sondaggi copre IPTW e può essere di aiuto. books.google.com/…
kaz_yos

Risposte:


11

Non hai bisogno del surveypacchetto o di qualcosa di complicato. Wooldridge (2010, p. 920 in poi) "Analisi econometrica di dati di sezioni trasversali e pannelli" ha una semplice procedura da cui è possibile ottenere gli errori standard per costruire gli intervalli di confidenza.

Partendo dal presupposto che tu abbia specificato correttamente il punteggio di propensione che denotiamo come , definisci il punteggio dalla stima del punteggio di propensione (ovvero il tuo primo logit o regressione probit ) as e lascia che come lo hai nella tua espressione sopra. Quindi prendi gli analoghi di esempio di queste due espressioni e regredisci sup(xi,γ)

di=γp(xi,γ)[Zip(xi,γ)]p(xi,γ)[1p(xi,γ)]
^ ATE i d iei
ATEi=[Zip(xi,γ)]Yip(xi,γ)[1p(xi,γ)]
ATE^id^i. Assicurati di includere un'intercettazione in questa regressione. Sia il residuo di quella regressione, quindi la varianza asintotica di è semplicemente . Quindi l'errore standard asintotico del tuo ATE è eiVar(ei) [ 1N(ATE^ATE)Var(ei)
[1NΣio=1Neio2]12N

È quindi possibile calcolare l'intervallo di confidenza nel solito modo (vedere ad esempio i commenti alla risposta qui per un esempio di codice). Non è necessario regolare nuovamente l'intervallo di confidenza per i pesi del punteggio di propensione inversa poiché questo passaggio è già stato incluso nel calcolo degli errori standard.

Sfortunatamente non sono un tipo R, quindi non posso fornirti il ​​codice specifico, ma la procedura descritta sopra dovrebbe essere semplice da seguire. Come nota a margine, questo è anche il modo in cui funziona il treatrewcomando in Stata. Questo comando è stato scritto e introdotto nello Stata Journal da Cerulli (2014) . Se non si ha accesso all'articolo, è possibile controllare le sue diapositive che descrivono anche la procedura di calcolo degli errori standard dalla ponderazione inversa del punteggio di propensione. Qui discute anche alcune lievi differenze concettuali tra la stima del punteggio di propensione tramite logit o probit ma per il bene di questa risposta non era eccessivamente importante, quindi ho omesso questa parte.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.