Penso di poter rispondere alle tue domande almeno per quanto riguarda le stime di ripetibilità non rettificate , ovvero le correlazioni classiche intra-class (ICC). Per quanto riguarda le stime di ripetibilità "adeguate", ho sfogliato il documento che hai collegato e non ho davvero visto dove si trova la formula che applichi nel documento? Basato sull'espressione matematica, sembra essere la ripetibilità dei punteggi medi (piuttosto che dei punteggi individuali). Ma non è chiaro che questa sia una parte critica della tua domanda, quindi la ignorerò.
(1.) Hanno senso i calcoli sopra riportati per ottenere la stima puntuale della ripetibilità di un effetto?
Sì, l'espressione che proponi ha un senso, ma è necessaria una leggera modifica alla formula proposta. Di seguito mostro come si potrebbe derivare il coefficiente di ripetibilità proposto. Spero che questo chiarisca entrambi il significato concettuale del coefficiente e mostri anche perché sarebbe auspicabile modificarlo leggermente.
Per iniziare, prendiamo innanzitutto il coefficiente di ripetibilità nel primo caso e chiariamo cosa significa e da dove viene. Comprendere questo ci aiuterà a capire il secondo caso più complicato.
Solo intercettazioni casuali
In questo caso, il modello misto per l' risposta nel gruppo è
dove le intercettazioni casuali hanno varianza e i residui hanno varianza .ij
yij=β0+u0j+eij,
u0jσ2u0eijσ2e
Ora, la correlazione tra due variabili casuali ed è definito come
xy
corr=cov(x,y)var(x)var(y)−−−−−−−−−−√.
L'espressione per coefficiente ICC / ripetibilità viene poi dal lasciare le due variabili casuali ed tramite due osservazioni tratte dallo stesso gruppo,
e se lo semplifichi usando le definizioni di cui sopra e le proprietà di varianze / covarianze (un processo che non mostrerò qui, a meno che tu o altri non preferireste che io abbia fatto), con
xyj
ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
ICC=σ2u0σ2u0+σ2e.
Ciò significa che l'ICC o "coefficiente di ripetibilità non aggiustato" in questo caso ha una semplice interpretazione della correlazione attesa tra una coppia di osservazioni dallo stesso cluster (al netto degli effetti fissi, che in questo caso è solo la media generale). Il fatto che l'ICC sia anche interpretabile come una
percentuale di varianza in questo caso è una coincidenza; tale interpretazione non è vera in generale per ICC più complicate. L'interpretazione come una sorta di correlazione è ciò che è primario.
Intercettazioni casuali e pendenze casuali
Ora per il secondo caso, dobbiamo prima chiarire cosa si intende esattamente con "l'affidabilità degli effetti (ovvero l'effetto di somma del contrasto di una variabile con 2 livelli)" - le tue parole.
Per prima cosa esponiamo il modello. Il modello misto per l' risposta nel ° gruppo sotto il ° livello di un predittore con codice di contrasto è
dove le intercettazioni casuali hanno varianza , le pendenze casuali hanno varianza , le intercettazioni casuali e la pendenza hanno covarianza e i residui hanno varianza .ijkx
yijk=β0+β1xk+u0j+u1jxk+eijk,
σ2u0σ2u1σu01eijσ2e
Allora, qual è la "ripetibilità di un effetto" sotto questo modello? Penso che una buona definizione del candidato sia che è la correlazione attesa tra due coppie di punteggi di differenza calcolati all'interno dello stesso cluster , ma attraverso diverse coppie di osservazioni .ji
Quindi la coppia di punteggi delle differenze in questione sarebbe (ricorda che abbiamo assunto che sia codificato in contrasto in modo che ):
e
x|x1|=|x2|=x
yi1jk2−yi1jk1=(β0−β0)+β1(xk2−xk1)+(u0j−u0j)+u1j(xk2−xk1)+(ei1jk2−ei1jk1)=2xβ1+2xu1j+ei1jk2−ei1jk1
yi2jk2−yi2jk1=2xβ1+2xu1j+ei2jk2−ei2jk1.
Inserendoli nella formula di correlazione ci dà
che semplifica fino a
Si noti che l'ICC è tecnicamente una funzione di ! Tuttavia, in questo caso può assumere solo 2 valori possibili e l'ICC è identico in entrambi questi valori.
ICC=cov(2xβ1+2xu1j+ei1jk2−ei1jk1,2xβ1+2xu1j+ei2jk2−ei2jk1)var(2xβ1+2xu1j+ei1jk2−ei1jk1)var(2xβ1+2xu1j+ei2jk2−ei2jk1)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
ICC=2x2σ2u12x2σ2u1+σ2e.
xx
Come puoi vedere, questo è molto simile al coefficiente di ripetibilità che hai proposto nella tua domanda, l'unica differenza è che la varianza della pendenza casuale deve essere adeguatamente ridimensionata se l'espressione deve essere interpretata come un ICC o "coefficiente di ripetibilità non rettificato". L'espressione che hai scritto funziona nel caso speciale in cui il predittore è codificato , ma non in generale.x±12√
(2.) Quando ho più variabili di cui voglio stimare la ripetibilità, aggiungendole tutte allo stesso adattamento (ad esempio lmer(dv~(iv1+iv2|unit)+iv1+iv2
) sembra produrre stime di ripetibilità più elevate rispetto alla creazione di un modello separato per ciascun effetto. Questo ha senso dal punto di vista computazionale per me, poiché l'inclusione di più effetti tenderà a ridurre la varianza residua, ma non sono sicuro che le stime di ripetibilità risultanti siano valide. Sono loro?
Credo che lavorare con una derivazione simile a quella presentata sopra per un modello con più predittori con le loro inclinazioni casuali mostrerebbe che il coefficiente di ripetibilità sopra sarebbe ancora valido, fatta eccezione per la complicazione aggiunta che i punteggi delle differenze a cui siamo concettualmente interessati ora hanno una definizione leggermente diversa: vale a dire, siamo interessati alla correlazione attesa delle differenze tra le medie rettificate dopo aver controllato gli altri predittori nel modello.
Se gli altri predittori sono ortogonali al predittore di interesse (come, ad esempio, in un esperimento equilibrato), penso che il coefficiente ICC / ripetibilità elaborato sopra dovrebbe funzionare senza alcuna modifica. Se non sono ortogonali, è necessario modificare la formula per tenerne conto, il che potrebbe complicarsi, ma si spera che la mia risposta abbia fornito alcuni suggerimenti su come potrebbe apparire.