Sto usando i dati individuali mensili CPS che vengono forniti wtfinl
come peso variabile.
Sto calcolando alcune statistiche annuali per i disoccupati. Lo faccio per
- Riassumendo
wtfinl
per tutte le osservazioni sui disoccupati per un determinato anno - Dividi tutti i
wtfinl
valori per la somma annuale, quindi moltiplica la variabile per questa quota relativa
Ad esempio, se la variabile è reddito, questo mi dà un reddito medio di disoccupati.
Ora vorrei avviare gli errori standard. Sono in Python. io
- prelevare campioni dalla tabella annuale completa, ogni riga con uguale probabilità
- Interrompi quando il numero di righe è uguale ai dati effettivi
- Applico quindi lo stesso stimatore di prima al campione, con ciascuna riga ponderata
wtfinl
Ora, quando calcolo le bande di confidenza, non sono centrate attorno al mio vero stimatore. Ancora peggio, per uno o due punti dati, lo stimatore è al di fuori delle bande.
Suppongo che sarebbe un modo alternativo per eseguire il bootstrap
io. Disegna dalla tabella annuale, ogni riga con probabilità relativa a wtfinl/wtfinl.sum()
. ii. Smettere di disegnare una volta wtfinl.sum()
è uguale a wtfinl.sum()
nei dati originali? iii. Quindi eseguire tutti i calcoli senza utilizzare i pesi.
Ho pensato che la mia strada fosse migliore perché (a) uso esattamente lo stesso stimatore entrambe le volte senza cambiare peso, e (b) è più chiaro: come farei (ii) esattamente? Quando ho spazio per la wtfinl=1
sinistra, disegno solo dalle righe con wtfinl <= 1
?
Tuttavia, dato che le mie bande di confidenza non si allineano alla mia stima originale, sono confuso. Cosa dovrei fare?