Temo di avere la risposta sfumata e forse insoddisfacente che sia una scelta soggettiva da parte del ricercatore o dell'analista di dati. Come menzionato altrove in questo thread, non è sufficiente dire semplicemente che i dati hanno una "struttura nidificata". Ad essere onesti, tuttavia, questo è il numero di libri che descrivono quando utilizzare i modelli multilivello. Ad esempio, ho appena estratto dal mio scaffale il libro di Joop Hox Multilevel Analysis , che dà questa definizione:
Un problema multilivello riguarda una popolazione con una struttura gerarchica.
Anche in un buon libro di testo, la definizione iniziale sembra essere circolare. Penso che ciò sia in parte dovuto alla soggettività nel determinare quando utilizzare quale tipo di modello (incluso un modello multilivello).
Un altro libro, West, Welch e Galecki's Linear Mixed Models afferma che questi modelli sono per:
variabili di risultato in cui i residui sono normalmente distribuiti ma potrebbero non essere indipendenti o avere una varianza costante. I progetti di studio che portano a set di dati che possono essere opportunamente analizzati utilizzando gli LMM includono (1) studi con dati raggruppati, come studenti in aule, o disegni sperimentali con blocchi casuali, come lotti di materie prime per un processo industriale, e (2) studi su misure longitudinali o ripetute, in cui i soggetti vengono misurati ripetutamente nel tempo o in condizioni diverse.
Finch, Bolin e Kelley Multilevel Modeling in R parla anche della violazione dell'ipotesi iid e dei residui correlati:
Di particolare importanza nel contesto della modellazione multilivello è l'assunzione [nella regressione standard] di termini di errore distribuiti in modo indipendente per le singole osservazioni all'interno di un campione. Questo presupposto significa essenzialmente che non ci sono relazioni tra gli individui nel campione per la variabile dipendente una volta che le variabili indipendenti nell'analisi sono state prese in considerazione.
Credo che un modello multilivello abbia senso quando c'è motivo di credere che le osservazioni non siano necessariamente indipendenti l'una dall'altra. Qualunque account "cluster" per questa non indipendenza può essere modellato.
Un esempio ovvio sarebbero i bambini in classe: stanno tutti interagendo tra loro, il che potrebbe portare i loro punteggi dei test a essere non indipendenti. Che cosa succede se una classe ha qualcuno che pone una domanda che porta a coprire materiale in quella classe che non è coperto in altre classi? E se l'insegnante è più sveglio per alcune lezioni rispetto ad altre? In questo caso, ci sarebbe una certa non indipendenza dei dati; in parole multilivello, potremmo aspettarci che una certa varianza nella variabile dipendente sia dovuta al cluster (cioè alla classe).
Il tuo esempio di cane contro elefante dipende dalle variabili indipendenti e dipendenti di interesse, credo. Ad esempio, supponiamo di chiedere se vi è un effetto della caffeina a livello di attività. Gli animali provenienti da tutto lo zoo sono assegnati in modo casuale a prendere una bevanda con caffeina o una bevanda di controllo.
Se siamo un ricercatore interessato alla caffeina, potremmo specificare un modello multilivello, perché ci teniamo davvero all'effetto della caffeina. Questo modello sarebbe specificato come:
activity ~ condition + (1+condition|species)
Ciò è particolarmente utile se ci sono un gran numero di specie su cui stiamo testando questa ipotesi. Tuttavia, un ricercatore potrebbe essere interessato agli effetti specifici della specie sulla caffeina. In tal caso, potrebbero specificare le specie come effetto fisso:
activity ~ condition + species + condition*species
Questo ovviamente è un problema se ci sono, diciamo, 30 specie, creando un design ingombrante 2 x 30. Tuttavia, puoi diventare abbastanza creativo con come modellare queste relazioni.
Ad esempio, alcuni ricercatori stanno sostenendo un uso ancora più ampio della modellazione multilivello. Gelman, Hill e Yajima (2012) sostengono che la modellazione multilivello potrebbe essere utilizzata come correzione per confronti multipli, anche nella ricerca sperimentale in cui la struttura dei dati non è ovviamente di natura gerarchica:
Problemi più difficili sorgono quando si modellano confronti multipli che hanno più struttura. Ad esempio, supponiamo di avere cinque misure di esito, tre varietà di trattamenti e sottogruppi classificati per due sessi e quattro gruppi razziali. Non vorremmo modellare questa struttura 2 × 3 × 4 × 5 come 120 gruppi intercambiabili. Anche in queste situazioni più complesse, pensiamo che la modellazione multilivello dovrebbe e finirà per sostituire le classiche procedure di confronto multiplo.
I problemi possono essere modellati in vari modi e, in casi ambigui, approcci multipli possono sembrare interessanti. Penso che il nostro compito sia scegliere un approccio ragionevole e informato e farlo in modo trasparente.