Coefficiente di correlazione intraclasse nel modello misto con pendenze casuali


10

Ho il seguente modello m_plotdotato di lme4::lmereffetti casuali incrociati per partecipanti ( lfdn) e oggetti ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Voglio conoscere i coefficienti di correlazione intraclasse (ICC) per partecipanti ed elementi. Grazie a questa grande risposta, in linea di principio so come ottenere l'ICC per il mio modello. Tuttavia, non sono sicuro se includere o meno le pendenze casuali:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Qual è la misura appropriata per la correlazione tra due risposte dello stesso partecipante rispetto allo stesso oggetto?


1
Merlo et al 2005 "Un breve tutorial concettuale sull'analisi multilivello nell'epidemiologia sociale: indagare i fenomeni contestuali in diversi gruppi di persone" potrebbe essere un riferimento utile.
N Brouwer,

@Henrik hai mai trovato una risposta a questa domanda? Anche io sono interessato.
Patrick S. Forscher l'

2
@ PatrickS.Forscher Per quanto ho capito, ICC non ha senso con pendenze casuali. L'ho imparato da Jake Westfall.
Henrik il

Hai un link a una lettura rilevante per caso?
Patrick S. Forscher,

1
@ PatrickS.Forscher Come puoi vedere, Jake Westfall ora ha fornito un'ottima risposta.
Henrik,

Risposte:


8

Fondamentalmente non esiste un singolo numero o una stima che possa riassumere il grado di raggruppamento in un modello di pendenze casuali.

La correlazione intra-class (ICC) può essere scritta solo come una semplice proporzione di varianze nei modelli a sola intercettazione casuale. Per capire perché, qui è possibile trovare uno schizzo della derivazione dell'espressione ICC .

Quando si gettano pendenze casuali nell'equazione del modello, seguire gli stessi passaggi conduce invece all'espressione ICC a pagina 5 di questo documento . Come puoi vedere, quell'espressione complicata è una funzione del predittore X. Per vedere più intuitivamente perché var (Y) dipende da X quando ci sono pendenze casuali, controlla la pagina 30 di queste diapositive ("Perché la varianza dipende da x ? ") .

Poiché l'ICC è una funzione dei predittori (i valori x), può essere calcolato solo per particolari insiemi di valori x. Potresti forse provare qualcosa come riportare l'ICC alla media congiunta dei valori x, ma questa stima sarà dimostrabilmente inaccurata per la maggior parte delle osservazioni.

Tutto ciò che ho detto si riferisce ancora solo ai casi in cui esiste un singolo fattore casuale. Con molteplici fattori casuali diventa ancora più complicato. Ad esempio, in un progetto multi-sito in cui i partecipanti di ciascun sito rispondono a un campione di stimoli (ovvero 3 fattori casuali: sito, partecipante, stimolo), potremmo chiedere molti ICC diversi: qual è la correlazione attesa tra due risposte nello stesso sito, con lo stesso stimolo, da diversi partecipanti? Che ne dici di siti diversi, lo stesso stimolo e partecipanti diversi? E così via. @rvl menziona queste complicazioni nella risposta a cui l'OP ha collegato.

Come puoi vedere, l'unico caso in cui possiamo riassumere il grado di raggruppamento con un singolo valore è il caso di intercettazione casuale a fattore casuale singolo. Poiché questa è una percentuale così piccola di casi del mondo reale, le ICC non sono così utili per la maggior parte del tempo. Quindi la mia raccomandazione generale è di non preoccuparsi nemmeno di loro. Invece raccomando solo di segnalare i componenti della varianza (preferibilmente in forma di deviazione standard).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.