Ripetibilità informatica degli effetti da un modello più leggero


28

Mi sono appena imbattuto in questo documento , che descrive come calcolare la ripetibilità ( nota anche come affidabilità, nota anche come correlazione intraclasse) di una misurazione tramite la modellazione di effetti misti. Il codice R sarebbe:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Ritengo che questo approccio possa essere utilizzato anche per calcolare l'affidabilità degli effetti (ovvero la somma dell'effetto di contrasto di una variabile con 2 livelli), come in:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Tre domande:

  1. Hanno senso i calcoli di cui sopra per ottenere la stima puntuale della ripetibilità di un effetto?
  2. Quando ho più variabili di cui voglio stimare la ripetibilità, aggiungendole tutte allo stesso adattamento (ad es. lmer(dv~(iv1+iv2|unit)+iv1+iv2) Sembra produrre stime di ripetibilità più elevate rispetto alla creazione di un modello separato per ciascun effetto. Questo ha senso dal punto di vista computazionale per me, poiché l'inclusione di più effetti tenderà a ridurre la varianza residua, ma non sono sicuro che le stime di ripetibilità risultanti siano valide. Sono loro?
  3. Il documento sopra citato suggerisce che la profilazione della probabilità potrebbe aiutarmi a ottenere intervalli di confidenza per le stime di ripetibilità, ma per quanto ne so, confint(profile(fit))fornisce solo intervalli per le varianze di intercettazione ed effetto, mentre avrei bisogno anche dell'intervallo per il calcolo della varianza residua l'intervallo per la ripetibilità, no?

Risposte:


6

Penso di poter rispondere alle tue domande almeno per quanto riguarda le stime di ripetibilità non rettificate , ovvero le correlazioni classiche intra-class (ICC). Per quanto riguarda le stime di ripetibilità "adeguate", ho sfogliato il documento che hai collegato e non ho davvero visto dove si trova la formula che applichi nel documento? Basato sull'espressione matematica, sembra essere la ripetibilità dei punteggi medi (piuttosto che dei punteggi individuali). Ma non è chiaro che questa sia una parte critica della tua domanda, quindi la ignorerò.

(1.) Hanno senso i calcoli sopra riportati per ottenere la stima puntuale della ripetibilità di un effetto?

Sì, l'espressione che proponi ha un senso, ma è necessaria una leggera modifica alla formula proposta. Di seguito mostro come si potrebbe derivare il coefficiente di ripetibilità proposto. Spero che questo chiarisca entrambi il significato concettuale del coefficiente e mostri anche perché sarebbe auspicabile modificarlo leggermente.

Per iniziare, prendiamo innanzitutto il coefficiente di ripetibilità nel primo caso e chiariamo cosa significa e da dove viene. Comprendere questo ci aiuterà a capire il secondo caso più complicato.

Solo intercettazioni casuali

In questo caso, il modello misto per l' risposta nel gruppo è dove le intercettazioni casuali hanno varianza e i residui hanno varianza .ij

yij=β0+u0j+eij,
u0jσu02eijσe2

Ora, la correlazione tra due variabili casuali ed è definito come xy

corr=cov(x,y)var(x)var(y).

L'espressione per coefficiente ICC / ripetibilità viene poi dal lasciare le due variabili casuali ed tramite due osservazioni tratte dallo stesso gruppo, e se lo semplifichi usando le definizioni di cui sopra e le proprietà di varianze / covarianze (un processo che non mostrerò qui, a meno che tu o altri non preferireste che io abbia fatto), con xyj

ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j),
ICC=σu02σu02+σe2.
Ciò significa che l'ICC o "coefficiente di ripetibilità non aggiustato" in questo caso ha una semplice interpretazione della correlazione attesa tra una coppia di osservazioni dallo stesso cluster (al netto degli effetti fissi, che in questo caso è solo la media generale). Il fatto che l'ICC sia anche interpretabile come una percentuale di varianza in questo caso è una coincidenza; tale interpretazione non è vera in generale per ICC più complicate. L'interpretazione come una sorta di correlazione è ciò che è primario.

Intercettazioni casuali e pendenze casuali

Ora per il secondo caso, dobbiamo prima chiarire cosa si intende esattamente con "l'affidabilità degli effetti (ovvero l'effetto di somma del contrasto di una variabile con 2 livelli)" - le tue parole.

Per prima cosa esponiamo il modello. Il modello misto per l' risposta nel ° gruppo sotto il ° livello di un predittore con codice di contrasto è dove le intercettazioni casuali hanno varianza , le pendenze casuali hanno varianza , le intercettazioni casuali e la pendenza hanno covarianza e i residui hanno varianza .ijkx

yijk=β0+β1xk+u0j+u1jxk+eijk,
σu02σu12σu01eijσe2

Allora, qual è la "ripetibilità di un effetto" sotto questo modello? Penso che una buona definizione del candidato sia che è la correlazione attesa tra due coppie di punteggi di differenza calcolati all'interno dello stesso cluster , ma attraverso diverse coppie di osservazioni .ji

Quindi la coppia di punteggi delle differenze in questione sarebbe (ricorda che abbiamo assunto che sia codificato in contrasto in modo che ): e x|x1|=|x2|=x

yi1jk2yi1jk1=(β0β0)+β1(xk2xk1)+(u0ju0j)+u1j(xk2xk1)+(ei1jk2ei1jk1)=2xβ1+2xu1j+ei1jk2ei1jk1
yi2jk2yi2jk1=2xβ1+2xu1j+ei2jk2ei2jk1.

Inserendoli nella formula di correlazione ci dà che semplifica fino a Si noti che l'ICC è tecnicamente una funzione di ! Tuttavia, in questo caso può assumere solo 2 valori possibili e l'ICC è identico in entrambi questi valori.

ICC=cov(2xβ1+2xu1j+ei1jk2ei1jk1,2xβ1+2xu1j+ei2jk2ei2jk1)var(2xβ1+2xu1j+ei1jk2ei1jk1)var(2xβ1+2xu1j+ei2jk2ei2jk1),
ICC=2x2σu122x2σu12+σe2.
xx

Come puoi vedere, questo è molto simile al coefficiente di ripetibilità che hai proposto nella tua domanda, l'unica differenza è che la varianza della pendenza casuale deve essere adeguatamente ridimensionata se l'espressione deve essere interpretata come un ICC o "coefficiente di ripetibilità non rettificato". L'espressione che hai scritto funziona nel caso speciale in cui il predittore è codificato , ma non in generale.x±12

(2.) Quando ho più variabili di cui voglio stimare la ripetibilità, aggiungendole tutte allo stesso adattamento (ad esempio lmer(dv~(iv1+iv2|unit)+iv1+iv2) sembra produrre stime di ripetibilità più elevate rispetto alla creazione di un modello separato per ciascun effetto. Questo ha senso dal punto di vista computazionale per me, poiché l'inclusione di più effetti tenderà a ridurre la varianza residua, ma non sono sicuro che le stime di ripetibilità risultanti siano valide. Sono loro?

Credo che lavorare con una derivazione simile a quella presentata sopra per un modello con più predittori con le loro inclinazioni casuali mostrerebbe che il coefficiente di ripetibilità sopra sarebbe ancora valido, fatta eccezione per la complicazione aggiunta che i punteggi delle differenze a cui siamo concettualmente interessati ora hanno una definizione leggermente diversa: vale a dire, siamo interessati alla correlazione attesa delle differenze tra le medie rettificate dopo aver controllato gli altri predittori nel modello.

Se gli altri predittori sono ortogonali al predittore di interesse (come, ad esempio, in un esperimento equilibrato), penso che il coefficiente ICC / ripetibilità elaborato sopra dovrebbe funzionare senza alcuna modifica. Se non sono ortogonali, è necessario modificare la formula per tenerne conto, il che potrebbe complicarsi, ma si spera che la mia risposta abbia fornito alcuni suggerimenti su come potrebbe apparire.


Hai ragione Jake. L'ICC rettificato si riferisce alla sezione VII. RIPETIBILITÀ E ERITABILITÀ ESTRAPOLATE nel documento collegato. Gli autori scrivono È importante distinguere tra la ripetibilità delle singole misurazioni e la ripetibilità dei mezzi di misurazioneRRn .
Gabra,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.