269

In termini semplici, come spiegheresti (forse con semplici esempi) la differenza tra modelli a effetti fissi, a caso e a effetti misti?

— Andrea
fonte

4

Trovo anche che a volte sia difficile determinare quando un effetto deve essere considerato come fisso o come effetto casuale. Sebbene ci siano alcune raccomandazioni su questo fatto, non sempre è facile prendere la decisione giusta.

— Manuel Ramón,

3

Penso che questo link possa essere utile per chiarire i principi di base dei modelli misti: modelli fissi, casuali e misti (documentazione SAS) .

— pietrop,

6

Una risposta estremamente utile può anche essere trovata qui: Qual è la differenza tra effetti casuali, effetti misti e modello marginale?

— gung

146

Lo statistico Andrew Gelman afferma che i termini "effetto fisso" e "effetto casuale" hanno significati variabili a seconda di chi li utilizza. Forse puoi scegliere quale delle 5 definizioni si applica al tuo caso. In generale può essere meglio cercare equazioni che descrivono il modello di probabilità che gli autori stanno utilizzando (durante la lettura) o scrivere l'intero modello di probabilità che si desidera utilizzare (durante la scrittura).

Qui delineamo cinque definizioni che abbiamo visto:

Gli effetti fissi sono costanti tra gli individui e gli effetti casuali variano. Ad esempio, in uno studio sulla crescita, un modello con intercettazioni casuali e pendenza fissa corrisponde a linee parallele per diversi individui , oppure il modello . Kreft e De Leeuw (1998) distinguono quindi tra coefficienti fissi e casuali. $a_i$ $b$ $i$ $y_{it} = a_i + b t$

Gli effetti sono fissi se sono interessanti in se stessi o casuali se vi è interesse per la popolazione sottostante. Searle, Casella e McCulloch (1992, Sezione 1.4) esplorano questa distinzione in profondità.

“Quando un campione esaurisce la popolazione, viene fissata la variabile corrispondente; quando il campione è una piccola parte (cioè trascurabile) della popolazione, la variabile corrispondente è casuale. ”(Green and Tukey, 1960)

"Se si presume che un effetto sia un valore realizzato di una variabile casuale, viene chiamato un effetto casuale." (LaMotte, 1983)

Gli effetti fissi sono stimati usando i minimi quadrati (o, più in generale, la massima probabilità) e gli effetti casuali sono stimati con il restringimento ("previsione imparziale lineare" nella terminologia di Robinson, 1991). Questa definizione è standard nella letteratura sulla modellazione multilivello (vedi, ad esempio, Snijders e Bosker, 1999, Sezione 4.2) e in econometria.

[ Gelman, 2004, Analisi della varianza: perché è più importante che mai. Gli annali delle statistiche. ]

— John Salvatier
fonte

4

+1: link molto bello! Immagino che la definizione vari anche a seconda del campo (ad es. Il n. 4 è molto matematico / statistico, ma il n. 1 e il n. 2 sono più "comprensibili" dal punto di vista delle scienze della vita)

— nico

12

È inoltre informativo leggere la discussione e la controreplica a questo documento. Nella discussione, Peter McCullagh ha scritto che non è d'accordo con una parte sostanziale di ciò che Gelman ha scritto. Il mio punto non è di favorire l'uno o l'altro, ma di notare che esiste un sostanziale disaccordo tra gli esperti e di non dare troppa importanza a un documento.

— Julieth

6

L'intera discussione è in collegamento

— Julieth

36

È divertente che Andrew Gelman sia descritto come un "blogger" piuttosto che come uno dei maggiori statistici al mondo oggi. Sebbene sia, ovviamente, un blogger, probabilmente dovrebbe essere chiamato "Statistico Andrew Gelman" se si utilizza un qualificatore.

— Brash Equilibrium,

4

Ma come statistico e non solo come un blogger sofisticato avrebbe dovuto mettere almeno le frequenze relative soggettive dell'uso dei cinque casi. Quando le persone parlano di effetti fissi vs effetti casuali, nella maggior parte dei casi significano:

(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)

— Ufo

253

Ci sono buoni libri su questo come Gelman e Hill . Ciò che segue è essenzialmente un riassunto della loro prospettiva.

Prima di tutto, non dovresti essere troppo preso dalla terminologia. In statistica, il gergo non dovrebbe mai essere usato come sostituto di una comprensione matematica dei modelli stessi. Ciò è particolarmente vero per i modelli di effetti casuali e misti. "Misto" significa solo che il modello ha effetti sia fissi che casuali, quindi concentriamoci sulla differenza tra fisso e casuale.

Effetti casuali contro effetti fissi

Supponiamo che tu abbia un modello con un predittore categorico, che divide le tue osservazioni in gruppi in base ai valori della categoria. * I coefficienti del modello, o "effetti", associati a quel predittore possono essere fissi o casuali. La differenza pratica più importante tra i due è questa:

Gli effetti casuali sono stimati con un pool parziale, mentre gli effetti fissi no.

Il raggruppamento parziale significa che, se si hanno pochi punti dati in un gruppo, la stima dell'effetto del gruppo si baserà parzialmente sui dati più abbondanti di altri gruppi. Questo può essere un buon compromesso tra la stima di un effetto raggruppando completamente tutti i gruppi, che maschera la variazione a livello di gruppo e la stima di un effetto per tutti i gruppi completamente separatamente, il che potrebbe dare scarse stime per i gruppi a basso campione.

Gli effetti casuali sono semplicemente l'estensione della tecnica di pooling parziale come modello statistico generale. Ciò consente l'applicazione di principio dell'idea in un'ampia varietà di situazioni, inclusi predittori multipli, variabili miste continue e categoriali e strutture di correlazione complesse. (Ma con un grande potere derivano grandi responsabilità: la complessità della modellazione e dell'inferenza è sostanzialmente aumentata e può dare origine a sottili pregiudizi che richiedono una notevole raffinatezza per evitare.)

Per motivare il modello di effetti casuali, chiediti: perché dovresti raggruppare parzialmente? Probabilmente perché pensi che i piccoli sottogruppi facciano parte di un gruppo più grande con un effetto medio comune. Le medie dei sottogruppi possono discostarsi leggermente dalla media dei grandi gruppi, ma non di una quantità arbitraria. Per formalizzare quell'idea, riteniamo che le deviazioni seguano una distribuzione, tipicamente gaussiana. È qui che entra in gioco il "random" in effetti random: stiamo assumendo che le deviazioni dei sottogruppi da un genitore seguano la distribuzione di una variabile casuale. Una volta che hai in mente questa idea, le equazioni del modello a effetti misti seguono naturalmente.

$\ell_2$

Sfortunatamente, la confusione del concetto causata da questi termini ha portato a una profusione di definizioni contrastanti . Delle cinque definizioni a questo link, solo il numero 4 è completamente corretto nel caso generale, ma è anche del tutto non informativo. Devi leggere interi articoli e libri (o, in mancanza, questo post) per capire cosa implica quella definizione nel lavoro pratico.

Esempio

Vediamo un caso in cui la modellazione di effetti casuali potrebbe essere utile. Supponiamo di voler stimare il reddito familiare medio degli Stati Uniti per codice postale. Hai un ampio set di dati contenente osservazioni sui redditi delle famiglie e sui codici postali. Alcuni codici postali sono ben rappresentati nel set di dati, ma altri hanno solo un paio di famiglie.

Per il tuo modello iniziale molto probabilmente otterrai il reddito medio in ogni ZIP. Funzionerà bene quando hai molti dati per un ZIP, ma le stime per i tuoi ZIP scarsamente campionati soffriranno di una varianza elevata. Puoi mitigarlo usando uno stimatore di contrazione (aka pooling parziale), che spingerà valori estremi verso il reddito medio in tutti i codici postali.

Ma quanta contrazione / pooling dovresti fare per un determinato ZIP? Intuitivamente, dovrebbe dipendere da quanto segue:

Quante osservazioni hai in quel ZIP
Quante osservazioni hai nel complesso
La media a livello individuale e la varianza del reddito familiare attraverso tutti i codici postali
La varianza a livello di gruppo nel reddito familiare medio in tutti i codici postali

Se si modella il codice postale come un effetto casuale, la stima del reddito medio in tutti i codici postali sarà soggetta a una riduzione statisticamente fondata, tenendo conto di tutti i fattori di cui sopra.

La parte migliore è che i modelli di effetti casuali e misti gestiscono automaticamente (4), la stima della variabilità, per tutti gli effetti casuali nel modello. Questo è più difficile di quanto sembri a prima vista: potresti provare la varianza della media del campione per ogni ZIP, ma questo sarà di parte, perché una parte della varianza tra le stime per diversi ZIP è solo la varianza di campionamento. In un modello a effetti casuali, il processo di inferenza tiene conto della varianza di campionamento e riduce di conseguenza la stima della varianza.

Avendo considerato (1) - (4), un modello di effetti casuali / misti è in grado di determinare la contrazione appropriata per gruppi a basso campione. Può anche gestire modelli molto più complicati con molti predittori diversi.

Relazione con la gerarchia bayesiana

Se questo suona come un modello gerarchico bayesiano per te, hai ragione: è un parente stretto ma non identico. I modelli di effetti misti sono gerarchici in quanto sostengono distribuzioni per parametri latenti e non osservati, ma in genere non sono completamente bayesiani perché agli iperparametri di livello superiore non verranno dati i priori appropriati. Ad esempio, nell'esempio sopra, molto probabilmente tratteremmo il reddito medio in un dato ZIP come un campione da una distribuzione normale, con media e sigma sconosciute da stimare mediante il processo di adattamento ad effetti misti. Tuttavia, un modello di effetti misti (non bayesiani) in genere non avrà una precedenza sulla media e sul sigma sconosciuti, quindi non è completamente bayesiano. Detto questo, con un set di dati di dimensioni decenti, il modello standard di effetti misti e la variante completamente bayesiana daranno spesso risultati molto simili.

* Mentre molti trattamenti di questo argomento si concentrano su una definizione ristretta di "gruppo", il concetto è in effetti molto flessibile: è solo un insieme di osservazioni che condividono una proprietà comune. Un gruppo potrebbe essere composto da più osservazioni di una singola persona, o più persone in una scuola, o più scuole in un distretto, o più varietà di un singolo tipo di frutta, o più tipi di verdura dello stesso raccolto o più raccolti dello stesso tipo di verdura, ecc. Qualsiasi variabile categoriale può essere utilizzata come variabile di raggruppamento.

— Paolo
fonte

19

+6. Penso che questa sia attualmente la migliore risposta in questo thread e speriamo che col tempo diventerà la più votata. Un suggerimento che vorrei formulare è quello di includere alcune formule: forse nella tua sezione Esempio puoi fornire formule che specificano i modelli a effetti fissi e casuali (e forse anche il modello a "singolo coefficiente", cioè quello con "pool completo" "). Penso che le formule renderanno la tua risposta più chiara e più attraente / accattivante (al momento sembra un po 'come un muro di testo).

— ameba,

3

@amoeba grazie! Hai ragione sul fatto che coefficiente sia la parola sbagliata, è più simile a "termine modello" che a coefficiente. Le formule aiuterebbero a chiarire questa e altre domande. Ho lentamente modificato questa risposta mentre il tempo e l'ispirazione colpiscono, e continuerò a farlo fino a quando non arriva dove deve andare! Probabilmente approfondirò le formule per "regressione contro una singola variabile categoriale". Pool completo = coefficienti di gruppo identici (delta precedente, zero sigma), pool parziale = possono differire un po '(sigma finito), no pool = nessun vincolo (sigma infinito).

— Paolo,

Grazie per la magnifica risposta! Tuttavia, ti ho perso in "Puoi mitigarlo usando uno stimatore di contrazione (aka pooling parziale), che spingerà valori estremi verso il reddito medio in tutti i codici postali". Cos'è il pool parziale? Potresti fare un esempio intuitivo? Inoltre, in che modo la pagina di Wikipedia sugli effetti casuali concorda con ciò che hai detto? Il loro esempio di "effetto casuale" non considera in alcun modo le dimensioni del campione.

— AlphaOmega,

2

Congratulazioni per aver passato 100 voti a favore di questa risposta :-)

— amoeba,

1

@Paul Sto davvero lottando per capire come unire questa risposta (es. "People ... think ... gli effetti fissi devono essere usati quando qualcosa è" riparato "mentre gli effetti casuali devono essere usati quando qualcosa viene" campionato casualmente ") con quello che vedo nel modo in cui gli errori standard si manifestano in modelli misti, in cui i SE con effetti casuali mi sembrano coerenti solo con l'assunto che sono campionati casualmente, e i SE con effetti fissi solo se sono corretti Vedi ad es . Qui Cosa mi manca? Qualche pensiero apprezzato oltre le parole !!

— justme

47

Ne ho scritto in un capitolo di un libro su modelli misti (capitolo 13 in Fox, Negrete-Yankelevich e Sosa 2014 ); le pagine pertinenti (pagg. 311-315) sono disponibili su Google Libri . Penso che la domanda si riduca a "quali sono le definizioni di effetti fissi e casuali?" (un "modello misto" è solo un modello che contiene entrambi). La mia discussione dice un po 'meno sulla loro definizione formale (per la quale rimanderei al documento Gelman collegato dalla risposta di @ JohnSalvatier sopra) e più sulle loro proprietà pratiche e utilità. Ecco alcuni estratti:

La visione tradizionale degli effetti casuali è un modo per eseguire test statistici corretti quando alcune osservazioni sono correlate.

Possiamo anche pensare agli effetti casuali come un modo per combinare informazioni da diversi livelli all'interno di una variabile di raggruppamento.

Gli effetti casuali sono particolarmente utili quando abbiamo (1) molti livelli (ad esempio, molte specie o blocchi), (2) dati relativamente scarsi su ogni livello (anche se abbiamo bisogno di più campioni dalla maggior parte dei livelli) e (3) irregolari campionamento tra i livelli (casella 13.1).

Frequentisti e bayesiani definiscono gli effetti casuali in modo leggermente diverso, il che influenza il modo in cui li usano. I frequentatori definiscono gli effetti casuali come variabili categoriche i cui livelli sono scelti a caso da una popolazione più ampia, ad esempio, le specie scelte a caso da un elenco di specie endemiche. I bayesiani definiscono effetti casuali come insiemi di variabili i cui parametri sono [tutti] tratti dalla [stessa] distribuzione. La definizione di frequentista è filosoficamente coerente e incontrerai ricercatori (inclusi revisori e supervisori) che insistono su di esso, ma può essere praticamente problematico. Ad esempio, implica che non puoi utilizzare le specie come effetto casuale quando hai osservato tutte le specie nel tuo sito di campo, poiché l'elenco delle specie non è un campione di una popolazione più ampia o usa l'anno come effetto casuale, poiché i ricercatori raramente eseguono un esperimento in anni campionati casualmente: di solito usano una serie di anni consecutivi o l'insieme casuale di anni in cui potevano entrare in campo.

Gli effetti casuali possono anche essere descritti come variabili predittive in cui sei interessato a fare inferenze sulla distribuzione dei valori (cioè la varianza tra i valori della risposta a diversi livelli) piuttosto che testare le differenze di valori tra livelli particolari.

Le persone a volte dicono che gli effetti casuali sono "fattori che non ti interessano". Questo non è sempre vero. Mentre è spesso il caso di esperimenti ecologici (in cui la variazione tra i siti è di solito solo un fastidio), a volte è di grande interesse, ad esempio in studi evolutivi in cui la variazione tra genotipi è la materia prima per la selezione naturale o in studi demografici dove le variazioni annue riducono i tassi di crescita a lungo termine. In alcuni casi, gli effetti fissi vengono utilizzati anche per controllare variazioni non interessanti, ad esempio, usando la massa come covariata per controllare gli effetti delle dimensioni del corpo.

Sentirai anche che "non puoi dire nulla sul valore (previsto) di una modalità condizionale". Neanche questo è vero: non puoi formalmente testare un'ipotesi nulla che il valore sia uguale a zero o che i valori di due diversi livelli sono uguali, ma è ancora perfettamente sensato esaminare il valore previsto e persino calcolare un errore standard del valore previsto (ad esempio, vedere le barre di errore attorno alle modalità condizionali nella figura 13.1).

$\textrm{species_mean} \sim {\cal N}(\textrm{genus_mean}, \sigma^2_{\textrm{species}})$

Ho detto sopra che gli effetti casuali sono più utili quando la variabile di raggruppamento ha molti livelli misurati. Al contrario, gli effetti casuali sono generalmente inefficaci quando la variabile di raggruppamento ha troppi livelli. Di solito non puoi usare effetti casuali quando la variabile di raggruppamento ha meno di cinque livelli e le stime della varianza degli effetti casuali sono instabili con meno di otto livelli, perché stai provando a stimare una varianza da un campione molto piccolo.

— Ben Bolker
fonte

l'anteprima non mostra attualmente pagine dopo il 311 e manca p 310, che sembra essere molto utile qui ...

— vola il

forse è un problema regionale? grazie per la chiara risposta sopra, comunque!

— vola il

1

Inoltre non ho accesso al risultato di Google Libri. Grazie per aver incluso il testo qui.

— MichaelChirico,

Mi piace molto questo estratto. Questa è forse la descrizione più chiara e utile su quando e perché usare effetti casuali che ho visto. Vorrei averlo avuto quando insegnavo un paio di anni fa.

— Gregor,

39

Effetto fisso: qualcosa che lo sperimentatore manipola direttamente ed è spesso ripetibile, ad esempio la somministrazione di farmaci: un gruppo riceve droga, un gruppo riceve placebo.

Effetto casuale: fonte di variazioni casuali / unità sperimentali, ad esempio individui prelevati (a caso) da una popolazione per una sperimentazione clinica. Gli effetti casuali stimano la variabilità

Effetto misto: include entrambi, l'effetto fisso in questi casi sta stimando i coefficienti a livello di popolazione, mentre gli effetti casuali possono tenere conto delle differenze individuali in risposta a un effetto, ad esempio, ogni persona riceve sia il farmaco che il placebo in diverse occasioni, il fisso l'effetto stima l'effetto del farmaco, i termini degli effetti casuali consentirebbero a ciascuna persona di rispondere al farmaco in modo diverso.

Categorie generali di effetti misti: misure ripetute, longitudinali, gerarchiche, a trama divisa.

— Matt Albrecht
fonte

3

Il tuo non è sbagliato, ma la tua definizione di cosa sia un effetto fisso non è ciò a cui penserei quando qualcuno dice un effetto fisso. Ecco cosa penso quando qualcuno dice effetto fisso en.wikipedia.org/wiki/Difference_in_differences , o questa stata.com/support/faqs/stat/xtreg2.html (in particolare l'equazione 3 nella pagina Stata)

— Andy W

@AndyW: Capisco correttamente che la tua comprensione di quale "effetto fisso" sia corrispondente alla definizione n. 1 come elencato da Gelman e citato nella risposta (accettata) di JohnSalvatier in questo thread?

— ameba,

1

a_{i}

$a_i$

1

a_{i}

$a_i$

1

@amoeba Sono d'accordo che questa risposta dovrebbe essere -1. Non fornisce una spiegazione generale accurata, né specifica le condizioni in cui questa particolare spiegazione sarebbe valida. Quindi chi potrebbe trovare questa risposta e acquisire conoscenze utili e affidabili?

— Paolo,

23

Sono arrivato a questa domanda da qui , un possibile duplicato.

Esistono già diverse risposte eccellenti, ma come indicato nella risposta accettata, ci sono molti usi diversi (ma correlati) del termine, quindi potrebbe essere utile dare la prospettiva come impiegato in econometria, che non sembra ancora essere affrontata qui .

y_{i t} = X_{i t} δ + α_{i} + η_{i t},

$y_{it}=X_{it}\delta+\alpha_i+\eta_{it},$

α_{i}

$\alpha_i$

η_{i t}

$\eta_{it}$

$\alpha_i$

$\alpha_i$ $X_{it}$ $Cov(\alpha_i,X_{it})=0$

$y$ $X$ $y_{it}$ $X_{it}$

$\alpha_i$ $X_{it}$ $i$ $X_{it}=0$ $X_{it}$

$\delta$ $t$ $\alpha_i$ $X_{it}$

$T$ m

Ecco il codice che genera i dati e che produce una stima RE positiva e una stima FE "corretta", negativa. (Detto questo, le stime di RE saranno spesso negative anche per altri semi, vedi sopra).

library(Jmisc)
library(plm)
library(RColorBrewer)
# FE illustration
set.seed(324)
m = 8
n = 12

step = 5
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
beta = -1
y = X = matrix(NA,nrow=m,ncol=n)
for (i in 1:n) {
  X[,i] = runif(m,i,i+1)
  X[,i] = rnorm(m,i)
  y[,i] = alpha[i] + X[,i]*beta + rnorm(m,sd=.75)  
}
stackX = as.vector(X)
stackY = as.vector(y)

darkcols <- brewer.pal(12, "Paired")
plot(stackX,stackY,col=rep(darkcols,each=m),pch=19)

unit = rep(1:n,each=m)
# first two columns are for plm to understand the panel structure
paneldata = data.frame(unit,rep(1:m,n),stackY,stackX) 
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

L'output:

> fe

Model Formula: stackY ~ stackX

Coefficients:
 stackX 
-1.0451 


> re

Model Formula: stackY ~ stackX

Coefficients:
(Intercept)      stackX 
   18.34586     0.77031

— Christoph Hanck
fonte

1

δ

$\delta$

1

Inoltre, si scopre che è possibile gestire questo esempio con effetti misti. Ecco il documento che mostra come: academiccommons.columbia.edu/download/fedora_content/download/…

— Paul,

1

T \to \infty

$T\to\infty$

N

$N$

7

Nella discussione precedente sarebbe più preciso sostituire "effetti casuali" con "la versione limitata di effetti casuali implementata nel pacchetto plm di R". Esistono altri modelli di effetti casuali che gestiscono bene il problema correlato predittore / gruppo, come nel documento citato nel mio commento precedente. Non fanno ancora parte dei pacchetti / letteratura di econometria. Sembra che le definizioni di econometria degli effetti fissi e casuali siano molto specifiche del dominio e non rappresentino realmente i loro significati generali più fondamentali dalla letteratura statistica.

— Paolo,

4

Giusto punto, ho fatto una piccola modifica. Ma imo, questo è esattamente ciò che rende questa discussione così preziosa: campi diversi significano cose diverse più o meno con la stessa terminologia, e i vari post aiutano a chiarire queste differenze.

— Christoph Hanck,

12

La distinzione è significativa solo nel contesto delle statistiche non bayesiane. Nelle statistiche bayesiane, tutti i parametri del modello sono "casuali".

— Shige
fonte

1

Interessante. Ma poiché fisso o casuale può essere considerato una condizione di una determinata variabile (una determinata colonna di dati) piuttosto che di un parametro associato a quella variabile, ... la tua risposta si applica pienamente?

— rolando2,

1

@ rolando2 In ogni caso, questo è semplicemente falso. In particolare, per i bayesiani i parametri sono qualunque tipo di cosa che la teoria / probabilità dice che sono. Solo la propria incertezza su quali valori assumono è rappresentata usando le distribuzioni di probabilità. Di conseguenza, a volte i parametri sono modellati come fissi e sconosciuti ("fissi") e talvolta come provenienti da una distribuzione ("casuale") sebbene quest'ultimo dispositivo sia spesso motivato da un giudizio di scambiabilità piuttosto che da una convinzione su un processo di campionamento.

— conjugateprior

Questo è in contrasto con la risposta di @ben. Credo che la risposta sia sbagliata.

— SmallChess

9

In econometria, i termini sono generalmente applicati in modelli lineari generalizzati, in cui il modello è della forma

y_{i t} = g (x_{i t} β + α_{i} + u_{i t}) .

$y_{it} = g(x_{it} \beta + \alpha_i + u_{it}).$

$\alpha_i \perp u_{it}$

$\alpha_i \not \perp u_{it}$

Nei modelli lineari , la presenza di un effetto casuale non provoca incoerenza con lo stimatore OLS. Tuttavia, l'uso di uno stimatore di effetti casuali (come i minimi quadrati generalizzati realizzabili) si tradurrà in uno stimatore più efficiente .

Nei modelli non lineari , come probit, tobit, ..., la presenza di un effetto casuale comporterà, in generale, uno stimatore incoerente. L'uso di uno stimatore di effetti casuali ripristinerà quindi la coerenza.

Sia per i modelli lineari che per quelli non lineari, gli effetti fissi producono una distorsione. Tuttavia, nei modelli lineari ci sono trasformazioni che possono essere utilizzate (come le prime differenze o il degrado), in cui OLS sui dati trasformati comporterà stime coerenti. Per i modelli non lineari, ci sono alcune eccezioni in cui esistono trasformazioni, il logit degli effetti fissi ne è un esempio.

Esempio: probit di effetti casuali. supporre

y_{i t}^{*} = x_{i t} β + α_{i} + u_{i t}, α_{i} \sim N (0, σ_{α}^{2}), u_{i t} \sim N (0, 1) .

$y^*_{it} = x_{it} \beta + \alpha_i + u_{it}, \quad \alpha_i \sim \mathcal{N}(0,\sigma_\alpha^2), u_{it} \sim \mathcal{N}(0,1).$

e il risultato osservato è

y_{i t} = 1 (y_{i t}^{*} > 0) .

$y_{it} = \mathbb{1}(y^*_{it} > 0).$

Lo stimatore della massima probabilità aggregata riduce al minimo la media del campione di

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log \prod_{t = 1}^{T} [G (x_{i t} β)]^{y_{i t}} [1 - G (x_{i t} β)]^{1 - y_{i t}} .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log \prod_{t=1}^T [G(x_{it}\beta)]^{y_{it}} [1 - G(x_{it}\beta)] ^{1-y_{it}}.$

Naturalmente, qui il registro e il prodotto semplificano, ma per ragioni pedagogiche, questo rende l'equazione più paragonabile allo stimatore di effetti casuali, che ha la forma

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log \int \prod_{t = 1}^{T} [G (x_{i t} β + σ_{α} a)]^{y_{i t}} [1 - G (x_{i t} β + σ_{α} a)]^{1 - y_{i t}} ϕ (a) d a .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log \int \prod_{t=1}^T [G(x_{it}\beta + \sigma_\alpha a)]^{y_{it}} [1 - G(x_{it}\beta + \sigma_\alpha a )] ^{1-y_{it}} \phi(a) \mathrm{d}a.$

Ad esempio, possiamo approssimare l'integrale mediante randomizzazione prendendo disegni di normali casuali e valutando la probabilità per ciascuno. $R$

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log R^{- 1} \sum_{r = 1}^{R} \prod_{t = 1}^{T} [G (x_{i t} β + σ_{α} a_{r})]^{y_{i t}} [1 - G (x_{i t} β + σ_{α} a)]^{1 - y_{i t}}, a_{r} \sim N (0, 1) .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log R^{-1} \sum_{r=1}^R \prod_{t=1}^T [G(x_{it}\beta + \sigma_\alpha a_r)]^{y_{it}} [1 - G(x_{it}\beta + \sigma_\alpha a )] ^{1-y_{it}},\quad a_r \sim \mathcal{N}(0,1).$

L'intuizione è la seguente: non sappiamo che tipo, , ogni osservazione è. Invece, valutiamo il prodotto delle probabilità nel tempo per una sequenza di pareggi. Il tipo più probabile per l'osservazione avrà il più alto rischio in tutti i periodi e pertanto dominare il contributo verosimiglianza per quel -sequence di osservazioni. $\alpha_i$ $i$ $T$

— Superpronker
fonte

7

Non proprio una definizione formale, ma mi piacciono le seguenti diapositive: Modelli misti e perché i sociolinguisti dovrebbero usarli ( specchio ), da Daniel Ezra Johnson. Un breve riassunto "è offerto nella diapositiva 4. Sebbene sia principalmente incentrato su studi psicolinguistici, è molto utile come primo passo.

— CHL
fonte

Penso che avrò bisogno di vedere quella presentazione di persona per ottenere il massimo impatto.

— Andy W,

Queste diapositive non sono utili.

— vola il

7

Sebbene questo collegamento possa rispondere alla domanda, è meglio includere qui le parti essenziali della risposta e fornire il collegamento come riferimento. Le risposte di solo collegamento possono diventare non valide se la pagina collegata cambia.

— Ben Bolker,

1

il link è morto

— baxx,

3

Un'altra prospettiva molto pratica sui modelli di effetti casuali e fissi viene dall'econometria quando si eseguono regressioni lineari sui dati del pannello . Se si sta valutando l'associazione tra una variabile esplicativa e una variabile di risultato in un set di dati con più campioni per individuo / gruppo, questo è il framework che si desidera utilizzare.

Un buon esempio di dati del panel sono le misurazioni annuali da un insieme di individui di:

$gender_i$ (genere del ° persona) $i$
${\Delta}weight_{it}$ (variazione di peso durante l'anno per la persona ) $t$ $i$
$exercise_{it}$ (esercizio giornaliero medio durante l'anno per persona ) $t$ $i$

Se stiamo cercando di capire la relazione tra esercizio fisico e cambiamento di peso, imposteremo la seguente regressione:

${\Delta}weight_{it} = \beta_0$ $exercise_{it} + \beta_1gender_i + \alpha_i + \epsilon_{it}$

$\beta_0$ è la quantità di interesse
$\beta_1$ non è interessante, stiamo solo controllando il genere con esso
$\alpha_i$ è l'intercettazione individuale
$\epsilon_{it}$ è il termine di errore

In una configurazione come questa c'è il rischio di endogeneità. Ciò può accadere quando variabili non misurate (come lo stato civile) sono associate sia all'esercizio fisico che al cambiamento di peso. Come spiegato a p.16 in questa lezione di Princeton , un modello a effetti casuali (effetti misti AKA) è più efficiente di un modello a effetti fissi. Tuttavia, attribuirà erroneamente alcuni degli effetti della variabile non sulla variazione di peso all'esercizio, producendo un errato e potenzialmente un significato statistico più elevato di quanto sia valido. In questo caso il modello degli effetti casuali non è uno stimatore coerente di . $\beta_0$ $\beta_0$

Un modello a effetti fissi (nella sua forma più semplice) controlla eventuali variabili non misurate che sono costanti nel tempo ma variano tra gli individui includendo esplicitamente un termine di intercettazione separato per ciascun individuo ( ) nell'equazione di regressione. Nel nostro esempio, controllerà automaticamente gli effetti confondenti del genere, nonché eventuali confonditori non misurati (stato civile, stato socioeconomico, livello di istruzione, ecc.). In effetti, il genere non può essere incluso nella regressione e non può essere stimato da un modello a effetti fissi, poiché è collineare con quello di . $\alpha_i$ $\beta_1$ $gender_i$ $\alpha_i$

Quindi, la domanda chiave è determinare quale modello è appropriato. La risposta è il test di Hausman . Per usarlo eseguiamo la regressione sia degli effetti fissi che casuali, quindi applichiamo il test di Hausman per vedere se le loro stime dei coefficienti divergono in modo significativo. Se divergono, l'endogeneità è in gioco e un modello a effetti fissi è la scelta migliore. Altrimenti, andremo con effetti casuali.

— Tom Q.
fonte

Qual è la differenza tra modelli a effetti fissi, a caso e a effetti misti?

Effetti casuali contro effetti fissi

Esempio

Relazione con la gerarchia bayesiana