L'occorrenza non così rara quando si ha a che fare con modelli misti massimi complessi (stimando tutti i possibili effetti casuali per dati e modello dati) è perfetta (+1 o -1) o correlazione quasi perfetta tra alcuni effetti casuali. Ai fini della discussione, osserviamo il seguente modello e riepilogo del modello
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
La presunta ragione dietro queste correlazioni perfette è che abbiamo creato un modello che è troppo complesso per i dati che abbiamo. Il consiglio comune che viene dato in queste situazioni è (ad esempio, Matuschek et al., 2017; carta ) di fissare i coefficienti sovra parametrizzati a 0, poiché tali modelli degeneri tendono ad abbassare la potenza. Se osserviamo un marcato cambiamento negli effetti fissi in un modello ridotto, dovremmo accettarlo; se non ci sono cambiamenti, allora non ci sono problemi ad accettare quello originale.
Tuttavia, supponiamo che non siamo interessati solo agli effetti fissi controllati per RE (effetti casuali), ma anche alla struttura RE. Nel caso specifico, sarebbe teoricamente corretto supporre che Intercepte la pendenza Xabbia una correlazione negativa diversa da zero. Seguono diverse domande:
Cosa fare in tali situazioni? Dovremmo segnalare la correlazione perfetta e dire che i nostri dati non sono "abbastanza buoni" per stimare la correlazione "reale"? O dovremmo segnalare il modello di correlazione 0? O forse dovremmo provare a impostare qualche altra correlazione su 0 nella speranza che quella "importante" non sia più perfetta? Non credo che ci siano risposte corrette al 100% qui, mi piacerebbe soprattutto sentire le tue opinioni.
Come scrivere il codice che fissa la correlazione di 2 effetti casuali specifici su 0, senza influenzare le correlazioni tra altri parametri?
blme, MCMCglmm, rstanarm, brms...)