Diagnostica residua e omogeneità delle varianze nel modello misto lineare


10

Prima di porre questa domanda, ho cercato nel nostro sito e ho trovato molte domande simili (come qui , qui e qui ). Ma ritengo che quelle domande correlate non abbiano avuto una risposta o una discussione, quindi vorrei sollevare di nuovo questa domanda. Penso che dovrebbe esserci un grande pubblico che desidera che questo tipo di domande sia spiegato più chiaramente.

Per le mie domande, considera innanzitutto il modello lineare ad effetti misti,

y=Xβ+Zγ+ϵ
dove Xβ è il componente lineare ad effetti fissi, Z è la matrice di progettazione aggiuntiva corrispondente ai parametri degli effetti casuali , γ . E ϵ  N(0,σ2I) è il solito termine di errore.

Supponiamo che l'unico fattore ad effetto fisso sia un trattamento a categoria variabile , con 3 livelli diversi. E l'unico fattore ad effetto casuale è il soggetto variabile . Detto questo, abbiamo un modello a effetti misti con effetto di trattamento fisso ed effetto soggetto casuale.

Le mie domande sono quindi:

  1. Esiste l'omogeneità dell'assunzione di varianza nell'impostazione di modelli misti lineari, analoga ai tradizionali modelli di regressione lineare? In tal caso, cosa significa specificamente l'assunzione nel contesto del problema del modello misto lineare sopra indicato? Quali sono altri presupposti importanti che devono essere valutati?

I miei pensieri: SÌ. le ipotesi (intendo, zero errore medio e uguale varianza) sono ancora da qui: . Nell'impostazione del modello di regressione lineare tradizionale, possiamo affermare che "la varianza degli errori (o solo la varianza della variabile dipendente) è costante in tutti e 3 i livelli di trattamento". Ma mi sono perso il modo in cui possiamo spiegare questo assunto sotto il modello misto. Dovremmo dire "le variazioni sono costanti su 3 livelli di trattamenti, condizionamento su soggetti? O no?"ϵ  N(0,σ2I)

  1. Il documento online SAS sui residui e la diagnostica dell'influenza ha portato alla luce due diversi residui, ovvero i residui marginali , e i residui condizionali , La mia domanda è: a cosa servono i due residui? Come potremmo usarli per verificare l'ipotesi di omogeneità? Per me, solo i residui marginali possono essere usati per affrontare il problema dell'omogeneità, poiché corrisponde al del modello. La mia comprensione qui è corretta?

    rm=YXβ^
    rc=YXβ^Zγ^=rmZγ^.
    ϵ
  2. Esistono prove proposte per testare l'assunzione di omogeneità in un modello misto lineare? @Kam ha sottolineato il test del levene in precedenza, sarebbe la strada giusta? In caso contrario, quali sono le indicazioni? Penso che dopo aver adattato il modello misto, possiamo ottenere i residui e forse possiamo fare alcuni test (come il test di bontà di adattamento?), Ma non sono sicuro di come sarebbe.

  3. Ho anche notato che ci sono tre tipi di residui di Proc Mixed in SAS, vale a dire il residuo Raw , il residuo Studentized e il residuo Pearson . Riesco a capire le differenze tra loro in termini di formule. Ma a me sembrano essere molto simili quando si tratta di trame di dati reali. Quindi, come dovrebbero essere usati in pratica? Ci sono situazioni in cui un tipo è preferito agli altri?

  4. Per un esempio di dati reali, i seguenti due grafici residui sono di Proc Mixed in SAS. In che modo si potrebbe affrontare il presupposto dell'omogeneità delle varianze?

[So di avere un paio di domande qui. Se potessi fornirmi uno qualsiasi dei tuoi pensieri per qualsiasi domanda, sarebbe fantastico. Non è necessario affrontarli tutti se non è possibile. Vorrei davvero discutere su di loro per ottenere la piena comprensione. Grazie!]

Ecco i grafici residui (grezzi) marginali. Ecco i grafici residui (grezzi) marginali.

Ecco i grafici residui (grezzi) condizionali. Ecco i grafici residui (grezzi) condizionali.


Grandi domande - una possibile risposta al tuo numero 2 può essere trovata qui comp.soft-sys.sas.narkive.com/7Qmrgufe/…
dandar

Risposte:


3

Penso che le domande 1 e 2 siano interconnesse. Innanzitutto, l'omogeneità dell'ipotesi della varianza viene da qui, . Ma questa ipotesi può essere ridotta a strutture di varianza più generali, in cui l'assunzione di omogeneità non è necessaria. Ciò significa che dipende davvero da come viene assunta la distribuzione di .ϵ  N(0,σ2I)ϵ

In secondo luogo, i residui condizionali vengono utilizzati per verificare la distribuzione di (quindi eventuali ipotesi correlate) , mentre i residui marginali possono essere utilizzati per verificare la struttura della varianza totale.ϵ


Sto affrontando alcuni degli stessi problemi di @AaronZeng. Cosa significa "controllare la struttura della varianza totale", per la quale dovrebbero essere usati i residui marginali? Come si potrebbe fare questo, e perché non si dovrebbe semplicemente concentrarsi sul controllo della struttura della varianza per ? Grazie. γ
clarpaul,

1

Questo è un argomento molto ampio e fornirò solo un quadro generale sulla connessione alla regressione lineare standard.

Nel modello elencato nella domanda, se , dove denota un soggetto o cluster. Sia . Usando la decomposizione di Cholesky , possiamo trasformare la matrice del risultato e del design,

yiN(Xiβ,ZiDZi+σ2I),
γiN(0,D)iΣi=ZiDZi+σ2IΣi=LiLi
yi=Li1yi;Xi=Li1Xi.

Come osservato nell'analisi longitudinale applicata (Pagina 268), la stima dei minimi quadrati generalizzati (GLS) di (regression on ) può essere rivalutata dalla regressione OLS di su . In questo modo è possibile utilizzare qui tutta la diagnostica residua integrata dall'OLS risultante .βyiXiyiXi

Quello che dobbiamo fare è:

  1. stima dalle stime dei componenti (marginali) residui o varianza nel modello misto lineare;Σi
  2. reinserire una regressione OLS utilizzando i dati trasformati.

La regressione OLS presuppone osservazioni indipendenti con varianza omogenea, quindi ai suoi residui possono essere applicate tecniche diagnostiche standard.

Molti più dettagli sono disponibili nel capitolo 10 "Analisi e diagnostica residue" del libro Applied Longitudinal Analysis . Hanno anche discusso della trasformazione del residuo con e ci sono alcuni grafici di residui (trasformati) (rispetto a valori previsti o predittori). Altre letture sono elencate in 10.8 "Altre letture" e nelle note bibliografiche ivi contenute.Li

Inoltre, a mio avviso, dato che supponiamo che siano indipendenti con una varianza omogenea, possiamo testare questi presupposti sui residui condizionali usando gli strumenti della regressione standard.ϵ


Un articolo di stampa su questo argomento.
Randel,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.