Quando i modelli misti a correlazione zero sono teoricamente validi?


25

La citazione di blocco riportata di seguito, dai leader nel campo della modellazione di effetti misti, afferma che coordinare i turni nei modelli con correlazione zero tra effetti casuali (modelli "ZCP") modifica le previsioni del modello. Ma qualcuno può approfondire o giustificare ulteriormente le sue affermazioni?

Le dichiarazioni in questione sono tratte dall'articolo del 2015 di Bates et allme4 , Fitting Linear Mixed-Effects Models che utilizza lme4 , pagina 7, secondo paragrafo ( link per il download ).

Ecco una parafrasi di ciò che hanno scritto:

Sebbene i modelli con parametri di correlazione zero vengano utilizzati per ridurre la complessità dei modelli a pendenza casuale, presentano uno svantaggio. I modelli in cui le pendenze e le intercettazioni possono avere una correlazione diversa da zero sono invarianti ai cambiamenti additivi di un predittore continuo.

Questa invarianza si interrompe quando la correlazione è limitata a zero; qualsiasi spostamento nel predittore porterà necessariamente a un cambiamento nella correlazione stimata, nella probabilità e nelle previsioni del modello. 1 Ad esempio, possiamo eliminare la correlazione in fm1 semplicemente spostando Days [il predittore che accompagna slope ] di un importo pari al rapporto tra le deviazioni standard stimate tra soggetti moltiplicate per la correlazione stimata, cioè 2 ,

ρslope:intercept×σslopeσintercept

L'uso di tali modelli dovrebbe idealmente essere limitato ai casi in cui il predittore viene misurato su una scala di rapporto (ovvero, il punto zero sulla scala è significativo, non solo una posizione definita dalla convenienza o dalla convenzione).

Domande:

Numerato secondo gli apici sopra ...

  1. Vedo che qualsiasi spostamento nel sistema di coordinate con cui viene misurato il predittore porterà a un cambiamento nella correlazione stimata, portando così a una correlazione diversa da zero. Ciò supporta l'affermazione secondo cui i modelli di parametri di correlazione zero non sono invarianti rispetto agli spostamenti nei sistemi di coordinate predittori, e quindi che qualsiasi modello con correlazioni di effetti casuali diversi da zero può essere trasformato in un modello con correlazioni zero da un opportuno spostamento delle coordinate. Penso che supporti anche il terzo paragrafo della parafrasi di cui sopra: i modelli ZCP (e i modelli di intercettazione zero - vedi sotto; ma per favore controlla qui ) sono validi solo per i modelli che utilizzano determinati sistemi di coordinate speciali. Ma perché uno spostamento coordinato dovrebbe cambiare le previsioni per tali modelli?

    Ad esempio, uno spostamento delle coordinate modificherà anche il termine dell'intercettazione ad effetto fisso per le medie di gruppo (vedere sotto), ma solo di un importo adeguato alla variazione di origine per il sistema di coordinate del predittore. Tale modifica non influisce sulle previsioni del modello, purché il nuovo sistema di coordinate venga utilizzato per il predittore spostato.

    Per elaborare, se la pendenza dell'effetto fisso associata al predittore spostato è positiva e l'origine del sistema di coordinate del predittore viene spostata nella direzione negativa, l'intercettazione dell'effetto fisso diminuirà e anche eventuali intercettazioni associate all'effetto casuale cambieranno di conseguenza, riflettendo la nuova definizione di "origine" (e quindi intercettare) nel sistema di coordinate spostato. A proposito, penso che questo ragionamento implichi anche che un modello di intercettazione zero non è invariante in tali turni.

  1. Penso di avere un modo ragionevole di risolverlo, ma ho ottenuto una risposta leggermente diversa da Bates et al. Sto sbagliando da qualche parte?

    Di seguito è la mia risposta. Di seguito è riportata la descrizione di come sono arrivato al mio risultato. In sintesi, trovo che se sposto l' origine negativamente di , in modo che nel nuovo sistema di coordinate il predittore assuma i valori , quindi la correlazione nel nuovo sistema di coordinate è zero se:δ > 0xδ>0ρ x=x+δρ

    δ=ρslope:intercept×σinterceptσslope

    Ciò differisce dal risultato di Bates et al .


Descrizione del mio metodo (lettura opzionale) : supponiamo di avere la correlazione di due effetti casuali, e ( in breve), entrambi corrispondenti allo stesso fattore di raggruppamento con livelli (numerati da , che vanno da a ). Diciamo anche che il predittore continuo con cui viene accoppiato il casuale viene chiamato , definito in modo tale che il prodotto generi il contributo condizionale al valore adattato per il livellointercetta int k i 1 k pendenza x x × pendenza i y o b s i ρ x pendenzaslopeinterceptintki1kslopexx×slopeiy^obsidel fattore di raggruppamento associato. Sebbene in realtà l'algoritmo MLE determini il valore di per massimizzare la probabilità , mi aspetterei che l'espressione sotto dovrebbe essere un modo dimensionalmente corretto per determinare gli effetti di una traduzione uniforme in , il moltiplicatore dell'effetto casuale per .ρxslope

ρslope:int=Ei[(slopeislopei¯)(intiinti¯)]Ei[(slopeislopei¯)2]Ei[(intiinti¯)2]

Per arrivare al mio risultato, ho prima riscritto il vecchio valore per l'intercetta in termini di un nuovo valore per l'intercetta, (qui, , il' verso sinistra 'spostamento in origine per predittore ). Quindi, ho sostituito l'espressione risultante nel numeratore della formula precedente per , calcolando il valore di che ha provocato una covarianza zero nel nuovo sistema di coordinate. Si noti che, come indicato nella precedente domanda 1 , anche il termine di intercettazione a effetto fisso cambierà in modo analogo: . (Qui,δ > 0 x ρ δ β 0 = - δ × β x + β 0 β x x .int=δ×slope+intδ>0xρδβ0=δ×βx+β0βxè il predittore ad effetto fisso associato al predittore spostato)x.


1
Alcune idee approssimative. cambia se (1) cambia la pendenza fissa o (2) cambia la pendenza casuale. Per (1): la pendenza fissa può essere vista come una media ponderata delle pendenze specifiche del cluster, dove il peso dipende in parte dai componenti di varianza stimati. Omettere la covarianza altera la var. stime, modifica dei pesi, modifica della pendenza fissa. Per (2): le pendenze casuali sono le pendenze specifiche del cluster "ristrette" verso la pendenza fissa in proporzione agli stessi pesi. Omettere la covarianza altera la var. stime, cambiando il grado di restringimento, cambiando le pendenze casuali. y^
Jake Westfall,

Sono un po 'deluso dal fatto che non abbia ricevuto più attenzione, @clarpaul. Potresti semplicemente inserire la tua risposta. Se nessun altro risponde, ti darò solo la generosità.
gung - Ripristina Monica

Grazie @gung, la mia risposta sarebbe strettamente allineata con le mie "Modifiche" sopra. La taglia sarebbe buona, ma potrei non avere tempo prima che scada. Incoraggio chiunque a prendere le mie "modifiche" e a trasformarle in una risposta, se concordano con il ragionamento di base e sono disposte a prendersi il tempo per lucidarle un po '.
clarpaul,

Risposte:


4
  1. La risposta a questa domanda risulta essere piuttosto definitiva . Se si spostassero le coordinate delle variabili indipendenti di un modello ZCP e si permettesse alle correlazioni di svilupparsi in modo non vincolato , le previsioni non cambierebbero, poiché i modelli lineari di effetti misti con correlazioni non vincolate sono invarianti rispetto alla traduzione (si può mostrare questo con un po 'di matematica) . Ma, per definizione , un modello ZCP ha correlazioni vincolate a . Su coordinate mobili, le correlazioni non sarebbero sviluppate come richiesto in un modello LME non vincolato. Pertanto, i modelli ZCP non sono invarianti per la traduzione e lo spostamento delle coordinate lo farebbe0cambia le previsioni del modello. E (se ci si aspetta che i modelli LME siano invarianti rispetto alla traduzione a sensibili spostamenti di coordinate) solo i modelli in cui tali spostamenti di coordinate non hanno senso sono teoricamente sensibili come i modelli ZCP (cioè, quelli "speciali" menzionati nel terzo paragrafo della parafrasi di Bates et al. sopra). [Nota: impreziosirò questa risposta in futuro per includere le formule che ho derivato per la correlazione che si sviluppa quando si spostano le coordinate di un modello ZCP inizialmente e per la prova che i modelli LME con correlazioni non vincolate sono invarianti per la traduzione.]
  2. Il risultato di Bates et al è semplicemente un errore di battitura. La risposta, , deve avere le stesse dimensioni del predittore, ( Days ), che viene spostato. Poiché, wlog, e possono essere considerati con dimensioni di unità, , che ha dimensioni (le stesse dimensioni della ), devono essere nel denominatore per per avere le dimensioni corrette.x σ i n t e r c e p t ρ σ s l o p e 1 / x s l o p e δδxσinterceptρσslope1/xslopeδ
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.