Sono confuso sull'ipotesi di normalità nelle misure ripetute ANOVA. In particolare, mi chiedo che tipo di normalità debba essere esattamente soddisfatta. Nel leggere la letteratura e le risposte sul CV, mi sono imbattuto in tre formulazioni distinte di questo assunto.
La variabile dipendente all'interno di ciascuna condizione (ripetuta) dovrebbe essere distribuita normalmente.
Si afferma spesso che rANOVA ha gli stessi presupposti di ANOVA, oltre alla sfericità. Questa è l'affermazione nelle statistiche di Field's Discovering , nonché nell'articolo di Wikipedia sull'argomento e nel testo di Lowry .
I residui (differenze tra tutte le possibili coppie?) Dovrebbero essere distribuiti normalmente.
Ho trovato questa affermazione in più risposte su CV ( 1 , 2 ). Per analogia di rANOVA con il test t accoppiato , questo potrebbe anche sembrare intuitivo.
La normalità multivariata dovrebbe essere soddisfatta.
Wikipedia e questa fonte ne parlano. Inoltre, so che rANOVA può essere scambiato con MANOVA, il che potrebbe meritare questa affermazione.
Sono equivalenti in qualche modo? So che la normalità multivariata significa che qualsiasi combinazione lineare dei DV è normalmente distribuita, quindi 3. includerebbe naturalmente 2. se capissi correttamente quest'ultimo.
Se questi non sono gli stessi, qual è il "vero" presupposto della rOVOVA? Potete fornire un riferimento?
Mi sembra che ci sia molto supporto per la prima affermazione. Ciò non è in linea, tuttavia, con le risposte generalmente fornite qui.
Modelli misti lineari
Grazie al suggerimento di @Uutobi, ora capisco come rANOVA può essere riformulato come modello misto lineare. In particolare, per modellare il modo in cui la pressione sanguigna cambia nel tempo, modellerei il valore atteso come: dove y i j sono misurazioni della pressione sanguigna, a i il sangue medio pressione del I soggetti -esimo, e come la tempo esimo l' soggetto -esimo è stata misurata, attestante che il cambiamento
Alla fine, ho cercato di pensare a cosa significhi per la normalità, ma con scarso successo. Per parafrasare McCulloch e Searle (2001, p. 35. Eq. (2.14)):
Capisco questo per dire che
4. I dati di ciascun individuo devono essere normalmente distribuiti, ma questo è irragionevole da testare con pochi punti temporali.
Prendo la terza espressione per dire che
5. le medie dei singoli soggetti sono normalmente distribuite. Si noti che queste sono altre due distinte possibilità in aggiunta alle tre sopra menzionate.
McCulloch, CE & Searle, SR (2001). Modelli generalizzati, lineari e misti . New York: John Wiley & Sons, Inc.