Errori standard cluster rispetto alla modellazione multilivello?


18

Ho sfogliato diversi libri (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill, ecc.) E diversi articoli (Gelman, Jusko, Primo & Jacobsmeier, ecc.), E ancora non ho ancora avvolto la testa le principali differenze tra l'utilizzo di errori standard cluster e la modellazione multilivello.

Comprendo le parti che hanno a che fare con la domanda di ricerca a portata di mano; ci sono alcuni tipi di risposte che puoi ottenere solo dalla modellazione multilivello. Tuttavia, ad esempio, per un modello a due livelli in cui i tuoi coefficienti di interesse sono solo al secondo livello, qual è il vantaggio di fare un metodo rispetto all'altro? In questo caso, non sono preoccupato di fare previsioni o estrarre singoli coefficienti per i cluster.

La differenza principale che sono riuscito a trovare è che gli errori standard cluster soffrono quando i cluster hanno dimensioni dei campioni disuguali e che la modellazione multilivello è debole in quanto presuppone una specifica della distribuzione casuale dei coefficienti (mentre l'utilizzo di errori standard cluster è privo di modelli) .

E alla fine, tutto ciò significa che per i modelli che potrebbero usare apparentemente entrambi i metodi, dovremmo ottenere risultati simili in termini di coefficienti ed errori standard?

Qualsiasi risposta o risorsa utile sarebbe molto apprezzata.


6
l'utente Stask ha una bella risposta a questa domanda .
Andy W,

Grazie. L'ho letto prima, il che in realtà mi ha reso più scettico sui benefici reali. Tuttavia, immagino che la vera motivazione alla base della mia domanda sia vedere se sono assolutamente convinto a pensare che non sia eccessivamente utile se guardo solo i coefficienti di livello 2 come interessanti. Inoltre, forse l'ho perso, ma non penso che il post abbia affrontato se questi due metodi dovrebbero produrre risultati simili (quando vengono soddisfatte le ipotesi di entrambi i metodi).
RickyB

1
Con "coefficienti al secondo livello" intendi il livello in cui i parametri del primo stadio sono variabili dipendenti?
sheß

Sì, questo è ciò che intendo.
RickyB,

Risposte:


1

Questo post si basa su esperienze personali che potrebbero essere specifiche dei miei dati, quindi non sono sicuro che si qualifichi come una risposta.

Suggerisco di utilizzare simulazioni se possibile per valutare quale metodo funziona meglio per i tuoi dati. Ho fatto questo e sono stato sorpreso di scoprire che i test (riguardanti i parametri nel primo livello) basati sulla modellazione multilivello stavano superando qualsiasi altro metodo (dal punto di vista del potere), mantenendo le dimensioni anche in piccoli campioni con pochi "cluster" di dimensioni non uniformi. Devo ancora trovare un documento che chiarisca questo punto, e da come lo vedo non è davvero un argomento di nicchia e merita più attenzione. Penso che sia poco studiato il modo in cui i diversi metodi confrontano rispetto al campione finito o ai cluster pochi / irregolari.


Grazie per il tuo commento. Hai qualche documento in cui hai registrato i tuoi risultati? Sarei molto interessato a guardarlo e vedere ciò che hai trovato (e, naturalmente, non vorrei citare, condividere o migliorare su di esso senza discuterne con te).
RickyB,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.