Differenza tra dati del pannello e modello misto


14

Vorrei sapere la differenza tra l'analisi dei dati del panel e l'analisi del modello misto. Per quanto ne so, sia i dati dei panel che i modelli misti utilizzano effetti fissi e casuali. In tal caso, perché hanno nomi diversi? O sono anche sinonimi?

Ho letto il seguente post, che descrive la definizione di effetti fissi, casuali e misti, ma non risponde esattamente alla mia domanda: qual è la differenza tra i modelli di effetti fissi, casuali e di effetti misti?

Le sarei anche grato se qualcuno potesse indicarmi un breve riferimento (circa 200 pagine) sull'analisi di modelli misti. Solo per aggiungere, preferirei un riferimento alla modellazione mista indipendentemente dal trattamento del software. Spiegazione principalmente teorica della modellazione mista.



Risposte:


22

Sia i dati del pannello che i dati del modello a effetti misti gestiscono variabili casuali doppie indicizzate . Il primo indice è per il gruppo, il secondo è per gli individui all'interno del gruppo. Per i dati del panel, il secondo indice è generalmente il tempo e si presume che osserviamo gli individui nel tempo. Quando il tempo è il secondo indice per il modello a effetto misto, i modelli sono chiamati modelli longitudinali. Il modello di effetti misti è meglio compreso in termini di regressioni di 2 livelli. (Per facilità di esposizione, assumere solo una variabile esplicativa)yioj

La regressione di primo livello è la seguente

yioj=αio+Xiojβio+εioj.

Questo è semplicemente spiegato come regressione individuale per ciascun gruppo. La regressione di secondo livello cerca di spiegare la variazione dei coefficienti di regressione:

β i = δ 0 + z i 2 δ 1 + v i

αio=γ0+zio1γ1+uio
βio=δ0+zio2δ1+vio

Quando sostituisci la seconda equazione con la prima che ottieni

yioj=γ0+zio1γ1+Xiojδ0+Xiojzio2δ1+uio+Xiojvio+εioj

Gli effetti fissi sono ciò che è fisso, questo significa . Gli effetti casuali sono u i e v i .γ0,γ1,δ0,δ1uiovio

Ora per i dati del pannello la terminologia cambia, ma è ancora possibile trovare punti comuni. I modelli di effetti casuali dei dati del pannello sono gli stessi del modello di effetti misti con

β i = δ 0

αio=γ0+uio
βio=δ0

con il modello che sta diventando

yiot=γ0+Xiotδ0+uio+εiot,

dove sono effetti casuali.uio

La differenza più importante tra il modello di effetti misti e i modelli di dati del pannello è il trattamento dei regressori . Per i modelli di effetti misti sono variabili non casuali, mentre per i modelli di dati del pannello si presume sempre che siano casuali. Questo diventa importante quando si afferma che cos'è il modello a effetti fissi per i dati del pannello.Xioj

Per il modello di effetti misti si presume che gli effetti casuali e v i siano indipendenti da ε i j e anche da x i j e z i , che è sempre vero quando x i j e z i sono fissi. Se permettiamo stocastico x i j questo diventa importante. Quindi il modello di effetti casuali per i dati del pannello presuppone che x i non sia correlato con u i . Ma il modello a effetto fisso che ha la stessa formauiovioεiojXiojzioXiojzioXiojXiotui

yit=γ0+xitδ0+ui+εit,

permette di correlazione e u i . L'enfasi è quindi solo per stimare costantemente δ 0 . Questo viene fatto sottraendo i singoli mezzi:xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

e utilizzando OLS semplice sul problema di regressione risultante. Algebricamente Ciò coincide con almeno un problema variabile minimi quadrati fittizia, dove assumiamo che parametri fissi. Da qui il nome modello a effetti fissi.ui

C'è molta storia dietro la terminologia degli effetti fissi e degli effetti casuali nell'econometria dei dati dei panel, che ho omesso. Secondo la mia opinione personale, questi modelli sono meglio spiegati nell '" Analisi econometrica della sezione trasversale e dei dati del pannello " di Wooldridge . Per quanto ne so non esiste una storia simile nel modello di effetti misti, ma d'altra parte vengo da un background di econometria, quindi potrei sbagliarmi.


...+Xiojvio+uio+εioj

Questa spiegazione è meravigliosa! Grazie mille per aver fatto tutto il possibile per darmi un'esposizione così meravigliosa. Voglio solo chiedere una cosa. Cosa intendi con regressione di 2 livelli?
Beta

2
@Ari, la regressione di secondo livello è una regressione per i coefficienti di regressione della regressione di primo livello. La regressione di primo livello cerca di spiegare la variazione all'interno del gruppo, mentre la regressione di secondo livello cerca di spiegare la variazione tra i gruppi. Questa divisione è artificiale, ma mi piace dal momento che mi sembra naturale almeno per me. Questo tipo di divisione viene utilizzato anche nei modelli gerarchici di Bayes.
mpiktas,

δ0

3

Capisco che stai cercando un testo che descriva la teoria della modellazione mista senza riferimento a un pacchetto software.

Consiglierei l' analisi multilivello, un'introduzione alla modellazione multilivello di base e avanzata di Tom Snijders e Roel Bosker, circa 250pp. Ha un capitolo sul software alla fine (che ora è in qualche modo obsoleto) ma il resto è una teoria molto accessibile.

Devo dire, tuttavia, che sono d'accordo con la raccomandazione sopra per i modelli multilivello e longitudinali che usano gli Stata di Sophia Rabe-Hesketh e Anders Skrondal. Il libro è molto teorico e il componente software è davvero solo una bella aggiunta a un testo sostanziale. Normalmente non uso Stata e ho il testo seduto sulla mia scrivania e lo trovo estremamente ben scritto. È comunque molto più lungo di 200pp.

I seguenti testi sono tutti scritti dagli attuali esperti del settore e sarebbero utili per chiunque desideri maggiori informazioni su queste tecniche (anche se non si adattano in modo specifico alla tua richiesta): [Non riesco a collegarmi a questi perché sono un nuovo utente, scusa]

Hoox, Joop (2010). Analisi multilivello, tecniche e applicazioni.

Gelman, A. e Hill, J. (2006) Analisi dei dati usando modelli di regressione e multilivello / gerarchici.

Singer, J. (2003) Applied Longitudinal Data Analysis: Modeling Change and Event Occasion

Raudenbush, SW e Bryk, A., S. (2002). Modelli lineari gerarchici: applicazioni e metodi di analisi dei dati

Luke, Douglas, (2004). Modellazione multilivello

Vorrei anche secondare il testo di Wooldridge menzionato sopra, così come il testo R, e il Centro universitario B ristol per la modellazione multilivello ha una serie di tutorial e informazioni


Grazie Playitagain! Questa è un'informazione molto utile. Anche il tuo nome è interessante :)
Beta,

2

Anch'io mi sono chiesto della differenza tra entrambi e avendo recentemente trovato un riferimento su questo argomento, capisco che "dati del pannello" è un nome tradizionale per i set di dati che rappresentano una "sezione trasversale o un gruppo di persone che vengono periodicamente esaminate su un intervallo di tempo ". Quindi il "pannello" è una struttura di gruppo all'interno del set di dati, e avere un tale gruppo il modo più naturale di analizzare questo tipo di dati è attraverso un approccio a modellistica mista.

Un buon riferimento (indipendentemente dal fatto che tu "parli" R o meno) sulla modellazione di effetti misti è la bozza di un (?) Libro di prossima pubblicazione di Douglas Bates ( lme4: modellazione di effetti misti con R ).


1
Grazie per il riferimento! Ma il problema rimane ancora.
Beta,


1

Se si utilizzano modelli Stata, multilivello e longitudinali, utilizzare Stata di Sophia Rabe-Hesketh e Anders Skrondal sarebbe una buona scelta. A seconda di cosa esattamente ti interessa, 200 pagine potrebbero essere corrette.


Grazie Dimitriy per il riferimento. Ma sfortunatamente non uso STATA. Uso principalmente SAS, e talvolta R. Ma grazie comunque.
Beta,

2
Ho sentito cose positive su wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html , ma non l'ho letto da solo.
Dimitriy V. Masterov,

Grazie Dimitriy! Sembra davvero promettente. Il vantaggio di porre domande piuttosto che fare goggling è che ottieni risultati davvero buoni :)
Beta

1

Nella mia esperienza, la logica per l'uso di "panel econometrics" è che gli stimatori del panel "effetti fissi" possono essere utilizzati per controllare varie forme di distorsione da variabili omesse.

Tuttavia, è possibile eseguire questo tipo di stima all'interno di un modello multilivello usando un approccio di tipo Mundlak , cioè includendo i mezzi del gruppo come regressori extra. Questo approccio rimuove la correlazione tra il termine di errore e i potenziali fattori omessi a livello di gruppo, rivelando il coefficiente "all'interno". Tuttavia, per una ragione a me sconosciuta, ciò non avviene in genere nella ricerca applicata. Queste diapositive e questo documento forniscono un'elaborazione.


(+1) I sociologi spesso interpretano i gruppi come effetti contestuali (anche se questo è più spesso per i dati della sezione trasversale nidificati che non per i dati del pannello delle serie temporali). Dovrò leggere, della nota correlata Manski (1993) ( PDF qui ) ha un articolo che mostra come tali effetti contestuali non vengano frequentemente identificati. Per "ragioni per cui ciò non viene fatto", sospetto che sia la differenza tra le pratiche delle scienze sociali di qualsiasi altra cosa, potrebbe essere una buona domanda da porre.
Andy W,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.