Sto cercando consigli su come analizzare dati di sondaggi complessi con modelli multilivello in R. Ho usato il survey
pacchetto per ponderare le probabilità diseguali di selezione nei modelli a un livello, ma questo pacchetto non ha funzioni per la modellazione multilivello. Il lme4
pacchetto è ottimo per la modellazione multilivello, ma non so come includere i pesi a diversi livelli di clustering. Asparouhov (2006) pone il problema:
I modelli multilivello vengono spesso utilizzati per analizzare i dati dai progetti di campionamento dei cluster. Tali progetti di campionamento tuttavia utilizzano spesso una disparità di selezione a livello di cluster e a livello individuale. I pesi di campionamento sono assegnati a uno o entrambi i livelli per riflettere queste probabilità. Se i pesi di campionamento vengono ignorati a entrambi i livelli, le stime dei parametri possono essere sostanzialmente distorte.
Un approccio per i modelli a due livelli è lo stimatore multilivello pseudo massima verosimiglianza (MPML) implementato in MPLUS ( Asparouhov et al,? ). Carle (2009) esamina i principali pacchetti software e fornisce alcuni consigli su come procedere:
Per condurre correttamente MLM con dati di sondaggi complessi e pesi di progettazione, gli analisti hanno bisogno di un software in grado di includere pesi in scala al di fuori del programma e includere i "nuovi" pesi in scala senza modifica automatica del programma. Attualmente, tre dei principali programmi software MLM lo consentono: Mplus (5.2), MLwiN (2.02) e GLLAMM. Sfortunatamente, né HLM né SAS possono farlo.
West e Galecki (2013) danno una recensione più aggiornata e citerò a lungo il passaggio pertinente:
Occasionalmente, gli analisti desiderano adattare gli LMM per rilevare set di dati raccolti da campioni con progetti complessi (vedi Heeringa et al, 2010, Capitolo 12). I progetti di campionamento complessi sono generalmente caratterizzati dalla divisione della popolazione in strati, dalla selezione multi-stadio di gruppi di individui all'interno degli strati e da probabilità ineguali di selezione per entrambi i gruppi e gli individui finali campionati. Queste ineguali probabilità di selezione portano generalmente alla costruzione di pesi di campionamento per gli individui, che garantiscono una stima imparziale dei parametri descrittivi quando incorporati in un'analisi. Questi pesi potrebbero essere ulteriormente adattati per la mancata risposta del sondaggio e calibrati sui totali noti della popolazione. tradizionalmente, gli analisti potrebbero prendere in considerazione un approccio basato sul design per incorporare queste complesse caratteristiche di campionamento nella stima dei modelli di regressione (Heeringa et al., 2010). Più recentemente, gli statistici hanno iniziato a esplorare approcci basati su modelli per l'analisi di questi dati, usando gli LMM per incorporare effetti fissi di strati di campionamento ed effetti casuali di cluster campionati.
La principale difficoltà nello sviluppo di approcci basati su modelli per l'analisi di questi dati è stata la scelta di metodi adeguati per incorporare i pesi di campionamento (vedere Gelman, 2007 per un riepilogo dei problemi). Pfeffermann et al. (1998), Asparouhov e Muthen (2006), Rabe-Hesketh e Skrondal (2006) hanno sviluppato una teoria per stimare i modelli multilivello in modo da incorporare i pesi dell'indagine, e Rabe-Hesketh e Skrondal (2006), Carle (2009) e Heeringa et al. (2010, capitolo 12) hanno presentato applicazioni utilizzando le attuali procedure software, ma questa continua ad essere un'area attiva di ricerca statistica. Le procedure software in grado di adattare gli MMM sono in varie fasi di attuazione degli approcci che sono stati finora proposti in letteratura per incorporare caratteristiche di progettazione complesse, e gli analisti devono tenerne conto quando si adattano gli LMM a dati di sondaggi campione complessi. Gli analisti interessati ad adattare gli LMM ai dati raccolti da indagini campionarie complesse saranno attratti da procedure in grado di incorporare correttamente i pesi dell'indagine nelle procedure di stima (HLM, MLwiN, Mplus, xtmixed e gllamm), coerenti con la presente letteratura in questo la zona.
Questo mi porta alla mia domanda: qualcuno ha raccomandazioni sulle migliori pratiche per adattare gli LMM a dati di sondaggi complessi in R?
lmer
funzione nel lme4
pacchetto consente di specificare un weights
argomento per il processo di adattamento del modello, quindi se si hanno pesi di progettazione fissi, si dovrebbe essere in grado di incorporarli con quell'argomento. Ho la parte sbagliata del bastone qui? C'è qualche motivo per cui questo è inadeguato alle tue esigenze?
i've never said it before
con questo post su addhealth potrebbero essere di interesse .. :(