Ho una serie di dati longitudinali di individui e alcuni di essi sono stati sottoposti a trattamento e altri no. Tutti gli individui sono nel campione dalla nascita fino all'età di 18 anni e il trattamento avviene a una certa età tra quella fascia. L'età del trattamento può variare a seconda dei casi. Usando la corrispondenza del punteggio di propensione vorrei abbinare le unità trattate e di controllo in coppia con una corrispondenza esatta nell'anno di nascita in modo tale da poter tracciare ciascuna coppia dalla loro nascita fino all'età di 18 anni. Complessivamente ci sono circa 150 individui trattati e 4000 non trattati. Dopo l'abbinamento, l'idea è quella di utilizzare una strategia di differenza nelle differenze per stimare l'effetto del trattamento.
Il problema che devo affrontare al momento è quello di fare la corrispondenza con i dati del pannello. Sto usando il psmatch2
comando di Stata e mi associo alle caratteristiche domestiche e individuali usando la corrispondenza del punteggio di propensione. In generale con i dati del panel ci saranno diverse corrispondenze ottimali ad ogni età. Ad esempio: se A viene trattato, B e C sono controlli e tutti sono nati nel 1980, allora A e B possono essere abbinati nel 1980 all'età di 0 anni mentre A e C sono abbinati nel 1981 all'età di 1 anno e così via . Anche A può essere abbinato ai propri valori di pretrattamento degli anni precedenti.
Per aggirare questo problema, ho preso la media di tutte le variabili variabili nel tempo in modo che la corrispondenza possa identificare le persone che sono in media le più simili per la durata del campione e faccio la corrispondenza separatamente per ogni fascia di età da 0 a 18 anni. Sfortunatamente, ciò corrisponde a un'unità di controllo diversa per ciascuna unità trattata per gruppo di età.
Se qualcuno potesse indirizzarmi verso un metodo per fare una corrispondenza a coppie con i dati del pannello in Stata, questo sarebbe molto apprezzato.