Cosa significherebbe un intervallo di confidenza attorno a un valore previsto da un modello di effetti misti?


14

Stavo guardando questa paginae ho notato i metodi per gli intervalli di confidenza per lme e lmer in R. Per coloro che non conoscono R, queste sono funzioni per generare effetti misti o modelli multi-livello. Se avessi effetti fissi in qualcosa come un disegno di misure ripetute cosa significherebbe un intervallo di confidenza attorno al valore previsto (simile alla media)? Posso capire che per un effetto puoi avere un ragionevole intervallo di confidenza, ma mi sembra impossibile un intervallo di confidenza attorno ad una media prevista in tali progetti. Potrebbe anche essere molto grande riconoscere il fatto che la variabile casuale contribuisce all'incertezza nella stima, ma in quel caso non sarebbe affatto utile in senso inferenziale confrontando i valori. O,

Mi sto perdendo qualcosa qui o la mia analisi della situazione è corretta? ... [e probabilmente una giustificazione del perché non è implementato in lmer (ma facile da ottenere in SAS). :)]


Poiché in sostanza la nidificazione in un lmer rende un disegno di misure ripetute esiste un modo in cui la tua domanda sull'intervallo di confidenza appropriato attorno alla dimensione dell'effetto è correlata alla domanda in ANOVA a misure ripetute su quale misura della dimensione dell'effetto riferire? In particolare, non è chiaro se il termine di errore debba includere la varianza del soggetto o meno (ecc.)?
Russellpierce,

Non importa - non ci ho pensato fino in fondo.
Russellpierce,

Risposte:


7

Ha lo stesso significato di qualsiasi altro intervallo di confidenza: supponendo che il modello sia corretto, se l'esperimento e la procedura vengono ripetuti più e più volte, il 95% delle volte il vero valore della quantità di interesse si troverà all'interno dell'intervallo. In questo caso, la quantità di interesse è il valore atteso della variabile di risposta.

Probabilmente è più semplice spiegarlo nel contesto di un modello lineare (i modelli misti sono solo un'estensione di questo, quindi valgono le stesse idee):

Il presupposto abituale è che:

yi=Xi1β1+Xi2β2+Xipβp+ϵ

dove è la risposta, X i j sono le covariate, β j sono i parametri e ϵ è il termine di errore che ha media zero. La quantità di interesse è quindi:yiXijβjϵ

E[yi]=Xi1β1+Xi2β2+Xipβp

che è una funzione lineare dei parametri (sconosciuti), poiché le covariate sono note (e fisse). Poiché conosciamo la distribuzione di campionamento del vettore dei parametri, possiamo facilmente calcolare la distribuzione di campionamento (e quindi l'intervallo di confidenza) di questa quantità.

Allora perché vorresti saperlo? Immagino che se stai facendo una previsione fuori campione, potrebbe dirti quanto dovrebbe essere buona la tua previsione (anche se dovresti prendere in considerazione l'incertezza del modello).


Questo è il mio secondo scenario, l'intervallo di confidenza è troppo grande per avere un valore inferenziale all'interno del progetto dell'esperimento poiché le differenze tra le condizioni si basano su effetti con la variabilità tra S rimossa. Sembra che abbia sempre un significato di compromesso e necessita del proprio nome speciale perché non è possibile utilizzarlo come un normale elemento della configurazione.
Giovanni,

Blouin & Riopelle (2005) li chiamarono intervalli di confidenza di inferenza ristretti e ampi, ma dato che la popolazione scientifica generale al di fuori delle statistiche ha tempi abbastanza difficili con quelli regolari ...
John

1

(yioj|μio)~N(μio,σw2),μio~N(μ,σB2),
μσw2σB2μio95%95%
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.