Ecco un esempio in cui un modello multilivello potrebbe essere "essenziale". Supponiamo di voler valutare la "qualità" dell'educazione fornita da un insieme di scuole usando i punteggi dei test degli studenti. Un modo per definire la qualità della scuola è in termini di prestazioni medie dei test dopo aver tenuto conto delle caratteristiche degli studenti. Si potrebbe concettualizzato questo come,
dove y i s è il punteggio di test continuo per gli studenti i nella scuola s , X i s
yI s= αS+ X'I sβS+ ϵI s,
yI sioSXI ssono studente attributi centrata a mezzo scuola,
è un coefficiente specifico per la scuola su questi attributi,
α s è un "effetto scuola" che la qualità misure scuola, e
ε i s sono idiosincrasie livello degli studenti in prova prendendo prestazioni. Interessi qui si concentra sulla stima del
α s 's, che misurano il 'valore aggiunto' che la scuola offre agli studenti una volta che i loro attributi sono contabilizzati-per. Volete prendere in considerazione le caratteristiche degli studenti, perché non volete punire una buona scuola che deve affrontare gli studenti con alcuni svantaggi, quindi i punteggi dei test medi deprimenti hanno disprezzato l'alto "valore aggiunto" che la scuola fornisce ai suoi studenti.
βSαSεI sαS
Con il modello in mano, il problema diventa di stima. Se hai molte scuole e molti dati per ogni scuola, le belle proprietà di OLS (vedi Angrist e Pischke, Mostly Harmless ..., per una revisione in corso) suggeriscono che si desidera utilizzarlo, con opportune modifiche agli errori standard per tenere conto delle dipendenze, e utilizzare variabili e interazioni fittizie per ottenere effetti a livello di scuola e intercettazioni specifiche della scuola. OLS può essere inefficiente, ma è così trasparente che potrebbe essere più facile convincere il pubblico scettico se lo usi. Ma se i tuoi dati sono scarsi in alcuni modi, in particolare se hai poche osservazioni per alcune scuole, potresti voler imporre più "struttura" al problema. Potresti voler "prendere in prestito la forza" dalle scuole con campioni più grandi per migliorare le stime rumorose che otterresti nelle scuole con campioni piccoli se le stime fossero fatte senza struttura. Quindi, potresti passare a un modello di effetti casuali stimato tramite FGLS,
In questo esempio, l'uso di un modello multilivello (comunque decidiamo di adattarlo, alla fine) è motivato dall'interesse diretto per le intercettazioni a livello di scuola. Naturalmente, in altre situazioni, questi parametri a livello di gruppo potrebbero non essere altro che un fastidio. La necessità o meno di adattarsi a loro (e, quindi, lavorare ancora con un qualche tipo di modello multilivello) dipende dal fatto che alcune ipotesi condizionali di esogeneità siano valide. A tale proposito, consiglierei di consultare la letteratura econometrica sui metodi dei dati dei panel; la maggior parte delle intuizioni da lì passa ai contesti di dati generali raggruppati.