Gli effetti casuali possono essere applicati solo alle variabili categoriali?


9

Questa domanda può sembrare stupida, ma ... è corretto che gli effetti casuali possano applicarsi solo alle variabili categoriali (come id individuale, id popolazione, ...), ad esempio diciamo che è una variabile categoriale:xi

yi ~βxi

βxi ~Norm(μ,δ2)

ma dal principio l' effetto casuale non può applicarsi alla variabile continua (come altezza, massa ...), diciamo :zi

yi ~α+βzi

perché allora esiste un solo coefficiente che non può essere vincolato? Sembra logico ma mi chiedo perché non sia mai menzionato nella letteratura statistica! Grazie!β

EDIT: Ma cosa succede se vincolo come ~ ? È quindi un effetto casuale? Ma questo è diverso dal vincolo che ho messo su - qui vincolo la variabile mentre nell'esempio precedente ho vincolato il coefficiente ! Comincia a sembrare un gran casino per me ... Comunque, non ha molto senso mettere questo vincolo, perché sono valori noti, quindi forse questa idea è completamente strana :-)z i N o r m ( μ , δ 2 ) β x iziozioNorm(μ,δ2)βXiozio


1
Interessante domanda correlata: stats.stackexchange.com/q/61531/5509
Curioso

Risposte:


5

Questa è una domanda buona e molto basilare.

L'interpretazione degli effetti casuali è molto specifica del dominio e dipende dalla scelta del modello (il modello statistico o essere bayesiano o frequentista). Per un'ottima discussione, vedi pagina 245, Gelman e Hill (2007) . Per un bayesiano tutto è casuale (anche se i parametri possono avere un vero valore fisso, sono modellati come casuali) e un frequentatore può anche scegliere un valore di parametro per essere un effetto fisso che sarebbe altrimenti modellato come casuale (vedi Casella, 2008 , discussione sui blocchi da correggere o casuali nell'esempio 3.2).

Modifica (dopo il commento)

I dati vengono corretti dopo averli osservati. Se sono continui, dovrebbero essere modellati come continui. È possibile modellare le variabili categoriali come categoriche e talvolta come continue (come in un'impostazione di variabile ordinale). I parametri sono sconosciuti e possono essere modellati come fissi o casuali. I parametri riguardano essenzialmente la risposta ai predittori. Se si desidera che l'inclinazione del singolo predittore (o il suo coefficiente in un modello lineare) vari per ogni risposta, modellarlo come casuale, altrimenti modellarlo come fisso. Allo stesso modo, se si desidera che l'intercettazione vari in relazione ai gruppi, allora dovrebbero essere modellati come casuali; altrimenti dovrebbero essere riparati.


1
Grazie per la tua risposta, ma mmm .... ho posto una domanda semplice e mi aspettavo una risposta in qualche modo semplice o generale :) Nel tuo secondo paragrafo affermi che in bayesiano tutto è casuale. Per favore, non complicarlo troppo :) Ho intenzionalmente chiesto a livello di modello, per favore dimentica il frequentista o il bayesiano - Sono interessato al principio - per quale tipo di variabili vengono generalmente utilizzati gli effetti casuali?
Curioso

Nel terzo paragrafo metti un'applicazione speciale con serie temporali, non sono sicuro di capirlo, ma le serie temporali AFAIK sono di solito discrete (non continue) se parli di correlazione seriale ... Comunque, se hai in qualche modo più generale rispondi, per favore condividi. Ancora una volta, grazie per la risposta!
Curioso

La casualità è in cose sconosciute. Quando hai osservazioni sono note! L'unica cosa che sai sono i tuoi dati. Gli incogniti sono i parametri e possono essere modellati come casuali o fissi. (scusate la confusione; sono d'accordo, ho reso inutilmente complicate le cose.)
suncoolsu

grazie per aver semplificato la tua risposta. Quindi, arrivando alla radice della mia domanda - questo significa che la risposta è , cioè gli effetti casuali si applicano solo alle variabili categoriali, perché gli effetti casuali si applicano solo ai parametri (non ai dati) e agli unici parametri che possono essere modellati come casuali sono quelli con più livelli, cioè quelli di una variabile categoriale? E i parametri delle variabili continue non possono essere modellati come casuali, perché esiste solo 1 valore di parametro per la variabile continua? Grazie!
Curioso

Nella tua impostazione specifica, la risposta è . Ma in generale la risposta, direi, è NO perché le variabili continue possono variare in base ai gruppi. Ad esempio, il reddito dei residenti in città dovrebbe essere più alto del villaggio (secondo te potrebbero essere due variabili categoriali separate per posizione).
suncoolsu,

3

La tua domanda potrebbe essere già stata risolta, ma in realtà è scritta in un libro di testo;

Gli effetti casuali sono variabili categoriali i cui livelli sono visti come un campione da una popolazione più ampia, al contrario degli effetti fissi, i cui livelli sono di interesse per se stessi,

sulla pagina 232 di: Alan Grafen e Rosie Hails (2002) "Statistiche moderne per le scienze della vita", Oxford University Press.


2
Questo è tutto vero, ma non credo che questo risponda alla domanda.
Patrick Coulombe,

1
Non sono d'accordo con il commento di @PatrickCoulombe sopra, penso che questo risponda esattamente alla domanda. +1.
ameba,

1

Penso che il problema sia che qui ci sono due cose. Un tipico esempio di effetti casuali potrebbe essere la previsione della media dei voti (GPA) di uno studente universitario in base a una serie di fattori, incluso il punteggio medio in una serie di test durante il liceo.

Il punteggio medio è continuo . In genere si avrebbe un'intercettazione, o intercettazione e pendenza variabili, per il punteggio medio per ciascun individuo. L'individuo è ovviamente categorico .

Quindi quando dici "si applica solo alle variabili categoriali" è un po 'vago. Supponi di considerare solo un'intercettazione casuale per il punteggio medio. In questo caso, la tua intercettazione casuale per una quantità continua e in effetti è probabilmente modellata come qualcosa come una variabile gaussiana con una deviazione media e standard che sarà determinata dalla procedura. Ma questa intercettazione casuale è determinata su una popolazione di studenti in cui ogni studente è identificato da una variabile categoriale.

È possibile utilizzare una variabile "continua" anziché l'ID studente. Forse potresti scegliere l'altezza di uno studente. Ma dovrebbe essenzialmente essere trattato come se fosse categorico. Se le tue misurazioni dell'altezza fossero molto precise, finiresti di nuovo con un'altezza unica per ogni studente, quindi non otterrai nulla di diverso. Se le tue misurazioni dell'altezza non fossero molto precise, finiresti per raggruppare più studenti ad ogni altezza. (Mescolando i loro punteggi in un modo forse mal definito.)

Questo è un po 'l'opposto delle interazioni. In un'interazione, stai moltiplicando due variabili e essenzialmente trattandole entrambe come continue. Una variabile categoriale verrebbe suddivisa in un insieme di variabili fittizie 0/1 e lo 0 o 1 verrebbe moltiplicato per l'altra variabile nell'interazione.

La linea di fondo è che un "effetto casuale" è in un certo senso solo un coefficiente che ha una distribuzione (è modellata) piuttosto che un valore fisso.


Accedi con il tuo account principale per poterlo modificare.
ameba,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.