Modello multilivello vs. modelli separati per ogni livello


10

Quali sono i vantaggi e gli svantaggi dell'esecuzione di modelli separati rispetto alla modellazione multilivello?

Più in particolare, supponiamo che uno studio abbia esaminato i pazienti nidificati nelle pratiche dei medici nidificati all'interno dei paesi. Quali sono i vantaggi / gli svantaggi della gestione di modelli separati per ciascun paese rispetto a un modello annidato a tre livelli?


2
Tecnicamente hai bisogno di un po 'di unità di livello 3 se hai intenzione di ottenere stime dei parametri imparziali in un modello a 3 livelli (in generale, la dimensione del campione in qualsiasi modello multilivello è particolarmente importante al livello più alto), quindi a meno che tu non abbia un ampio campione casuale di paesi (forse più di 50), dovresti probabilmente considerare l'esecuzione di modelli a 2 livelli separati o, se hai pochi paesi, potresti considerare il trattamento del paese come un predittore di livello 2 categorico in un modello a 2 livelli
Patrick Coulombe,

Ciao @gung ero via, li guarderò ora.
Peter Flom

Risposte:


6

La domanda è datata ma penso che sia molto importante. La migliore risposta che posso ottenere è dal libro di Joop J Hox (2010) "Tecniche e applicazioni di analisi multilivello, seconda edizione".

Supponiamo che i dati gerarchici a due livelli con variabili esplicative al livello più basso e variabili esplicative al livello più alto. Quindi, a pagina 55, scrive:qpq

Un normale modello di regressione a livello singolo per gli stessi dati stimerebbe solo le pendenze di intercettazione, una varianza di errore e la regressione p + q. La superiorità del modello di regressione multilivello è chiara, se si considera che i dati sono raggruppati in gruppi. Se abbiamo 100 gruppi, la stima di un modello di regressione multipla ordinaria in ciascun gruppo separatamente richiede la stima di 100 × (1 intercetta di regressione + 1 varianza residua + pendenze di regressione p) più possibili interazioni con le variabili a livello di gruppo q. La regressione multilivello sostituisce la stima di 100 intercettazioni stimando un'intercettazione media più la sua varianza residua tra i gruppi, assumendo una distribuzione normale per questi residui. Così, l'analisi di regressione multilivello sostituisce la stima di 100 intercettazioni separate stimando due parametri (la media e la varianza delle intercettazioni), più un'ipotesi di normalità. La stessa semplificazione viene utilizzata per le pendenze di regressione. Invece di stimare 100 pendenze per il genere esplicativo della pupilla variabile, stimiamo la pendenza media insieme alla sua varianza tra i gruppi e supponiamo che la distribuzione delle pendenze sia normale. Tuttavia, anche con un numero modesto di variabili esplicative, l'analisi della regressione multilivello implica un modello complicato. In generale, non vogliamo stimare il modello completo, in primo luogo perché è probabile che ciò ci porti a problemi computazionali, ma anche perché è molto difficile interpretare un modello così complesso.

Questo è per la descrizione. Ora le pagine 29-30 risponderanno alla tua domanda in modo più accurato.

Le intercettazioni e le pendenze previste per le 100 classi non sono identiche ai valori che otterremmo se avessimo effettuato 100 analisi di regressione ordinaria separate in ciascuna delle 100 classi, utilizzando tecniche di minimi quadrati ordinari standard (OLS). Se dovessimo confrontare i risultati di 100 analisi di regressione OLS separate con i valori ottenuti da un'analisi di regressione multilivello, scopriremmo che i risultati delle analisi separate sono più variabili. Questo perché vengono ponderate le stime multilivello dei coefficienti di regressione delle 100 classi. Sono le cosiddette Bayes empiriche (EB) o stime di contrazione: una media ponderata della stima OLS specifica in ciascuna classe e del coefficiente di regressione globale, stimato per tutte le classi simili.

Di conseguenza, i coefficienti di regressione vengono ridotti verso il coefficiente medio per l'intero set di dati. Il peso di restringimento dipende dall'affidabilità del coefficiente stimato. I coefficienti stimati con una precisione ridotta si riducono più dei coefficienti stimati con molta precisione. La precisione della stima dipende da due fattori: la dimensione del campione del gruppo e la distanza tra la stima basata sul gruppo e la stima complessiva. Le stime per i piccoli gruppi sono meno affidabili e si riducono più delle stime per i grandi gruppi. A parità di altre condizioni, le stime molto lontane dalla stima complessiva sono ritenute meno affidabili e si riducono più delle stime vicine alla media complessiva. Il metodo statistico utilizzato è chiamato stima empirica di Bayes. A causa di questo effetto di restringimento, gli stimatori empirici di Bayes sono di parte. Tuttavia, di solito sono più precisi, una proprietà che è spesso più utile dell'essere imparziale (vedi Kendall, 1959).

Spero sia soddisfacente.


2

La specifica di un effetto casuale implica l'assunzione che i mezzi di tali livelli siano campioni da una distribuzione normale. Meglio specificarli come effetti fissi, variabili fittizie AKA se questo presupposto non si adatta ai tuoi dati. In questo modo stai controllando l'eterogeneità a livello di gruppo nella media (a quel livello), ma NON stai permettendo l'eterogeneità nelle risposte alle tue variabili di livello inferiore.

Se ti aspetti l'eterogeneità in risposta alle tue variabili esplicative di livello inferiore, i modelli separati hanno senso, a meno che tu non voglia eseguire una sorta di modello di coefficiente casuale (che implica ancora l'assunzione che i coefficienti siano normalmente distribuiti).

(Credo che ci siano metodi per effetti casuali non normali, ma niente di così ampiamente usato o accessibile come lme)


1

Vantaggio: la capacità di testare esplicitamente le differenze nei parametri per cluster (ovvero differenze di significatività non significano differenze significative).


2
Questa risposta è troppo breve. Più di un commento che di una risposta.
Eric Peterson,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.