Questa è una domanda piuttosto vecchia con alcune risposte molto buone, tuttavia penso che possa beneficiare di una nuova risposta per affrontare una prospettiva più pragmatica.
Quando non si dovrebbe permettere a un effetto fisso di variare tra i livelli di un effetto casuale?
Non affronterò i problemi già descritti nelle altre risposte, invece farò riferimento all'ormai famoso, anche se preferirei dire un articolo "famigerato" di Barr et al (2013) spesso definito semplicemente "Keep it maximal"
Barr, DJ, Levy, R., Scheepers, C. and Tily, HJ, 2013. Struttura di effetti casuali per test di ipotesi di conferma: mantenerlo al massimo. Journal of memory and language, 68 (3), pagg. 255-278.
In questo articolo gli autori sostengono che tutti gli effetti fissi dovrebbero poter variare tra i livelli dei fattori di raggruppamento (intercettazioni casuali). La loro argomentazione è piuttosto avvincente - in sostanza, non permettendo loro di variare, impone vincoli al modello. Questo è ben descritto nelle altre risposte. Tuttavia, ci sono problemi potenzialmente gravi con questo approccio, che sono descritti da Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. e Baayen, H., 2015. Modelli misti parsimoniosi. arXiv prestampa arXiv: 1506.04967
Vale la pena notare qui che Bates è l'autore principale del lme4pacchetto per il montaggio di modelli misti in R, che è probabilmente il pacchetto più utilizzato per tali modelli. Bates et al. Notano che in molte applicazioni del mondo reale, i dati semplicemente non supporteranno una struttura di effetti casuali massima, spesso perché ci sono un numero insufficiente di osservazioni in ciascun cluster per le variabili rilevanti. Questo può manifestarsi in modelli che non riescono a convergere o sono singolari negli effetti casuali. Il gran numero di domande su questo sito su tali modelli lo attesta. Notano anche che Barr et al. Hanno usato una simulazione relativamente semplice, con effetti casuali "ben educati" come base per il loro articolo. Invece Bates et al suggeriscono il seguente approccio:
Abbiamo proposto (1) di utilizzare PCA per determinare la dimensionalità della matrice varianza-covarianza della struttura ad effetto casuale, (2) per limitare inizialmente i parametri di correlazione a zero, soprattutto quando un tentativo iniziale di adattamento a un modello massimo non converge, e (3) eliminare dal modello componenti di varianza non significativi e i relativi parametri di correlazione associati
Nello stesso documento, notano anche:
È importante sottolineare che la mancata convergenza non è dovuta a difetti dell'algoritmo di stima, ma è una conseguenza diretta del tentativo di adattare un modello che è troppo complesso per essere adeguatamente supportato dai dati.
E:
non sono necessari modelli massimi per proteggersi da conclusioni anti-conservative. Questa protezione è completamente fornita da modelli globali che sono guidati da aspettative realistiche sulla complessità che i dati possono supportare. In statistica, come altrove nella scienza, la parsimonia è una virtù, non un vizio.
Bates et al (2015)
Da una prospettiva più applicata, un'ulteriore considerazione da prendere è se il processo di generazione dei dati, la teoria biologica / fisica / chimica che sta alla base dei dati, debba guidare l'analista a specificare la struttura degli effetti casuali.