Perché misure ripetute ANOVA assumono la sfericità?


10

Perché misure ripetute ANOVA assumono la sfericità?

Per sfericità intendo il presupposto che la varianza di tutte le differenze a coppie tra gruppi dovrebbe essere la stessa.

In particolare, non capisco perché questo dovrebbe essere il presupposto e non che le varianze dei punteggi dei gruppi osservati siano uguali.


1
Come ho commentato qui , perché le variabili di differenza tra i livelli di RM sono legate, dalla loro origine, la sfericità implica quindi che abbiano le stesse varianze.
ttnphns,

1
Prima di rispondere, sarebbe utile sapere se si capisce perché le misure indipendenti ANOVA presuppone l'omogeneità della varianza.
Giovanni,

@John La mia comprensione è questa la risposta data a stats.stackexchange.com/questions/81914/… risponde correttamente a questa domanda.
user1205901 - Ripristina Monica

@ttnphns Purtroppo non capisco bene la tua risposta. Saresti interessato a qualche altro poster per trasformarlo in una risposta più dettagliata?
user1205901 - Ripristina Monica

Risposte:


2

Intuizione alla base dell'assunzione di sfericità

Una delle ipotesi di misure comuni e non ripetute, ANOVA è la stessa varianza in tutti i gruppi.

(Possiamo comprenderlo perché la varianza uguale, nota anche come omoscedasticità , è necessaria affinché lo stimatore OLS nella regressione lineare sia BLU e affinché i corrispondenti test t siano validi, vedere il teorema di Gauss-Markov . E ANOVA può essere implementato come lineare regressione.)

Quindi proviamo a ridurre il caso RM-ANOVA al caso non RM. Per semplicità, mi occuperò di RM-ANOVA a un fattore (senza effetti tra soggetti) che ha soggetti registrati in k condizioni RM.nK

Ogni soggetto può avere il proprio offset o intercettazione specifico per soggetto. Se sottraggiamo i valori di un gruppo dai valori di tutti gli altri gruppi, annulleremo queste intercettazioni e arriveremo alla situazione in cui possiamo usare non-RM-ANOVA per verificare se queste differenze di gruppo sono tutte zero. Affinché questo test sia valido, abbiamo bisogno di presupporre che le differenze di k - 1 siano uguali .K-1K-1

Ora possiamo sottrarre il gruppo n. 2 da tutti gli altri gruppi, arrivando di nuovo a differenze che dovrebbero anche avere varianze uguali. Per ogni gruppo su k , le varianze delle corrispondenti differenze k - 1 dovrebbero essere uguali. Segue rapidamente che tutte le possibili differenze k ( k - 1 ) / 2 dovrebbero essere uguali.K-1KK-1K(K-1)/2

Qual è esattamente il presupposto della sfericità.

Perché le varianze di gruppo non dovrebbero essere uguali?

Quando pensiamo a RM-ANOVA, di solito pensiamo a un semplice modello di tipo misto modello additivo della forma dove α i sono effetti soggetto, β j sono effetti di condizione e ϵ N ( 0 , σ 2 ) .

yioj=μ+αio+βj+εioj,
αioβjε~N(0,σ2)

Per questo modello, le differenze di gruppo seguiranno , ovvero avranno tutte la stessa varianza 2 σN(βj1-βj2,2σ2) , quindi vale la sfericità. Ma ogni gruppo seguirà una miscela di n gaussiani con mezzi a α i e varianze σ 2 , che è una distribuzione complicata con varianza V ( α , σ 2 ) che è costante tra i gruppi.2σ2nαioσ2V(α,σ2)

Quindi, in questo modello, anche le variazioni di gruppo sono uguali. Anche le covarianze di gruppo sono le stesse, nel senso che questo modello implica una simmetria composta . Questa è una condizione più rigorosa rispetto alla sfericità. Come mostra il mio argomento intuitivo sopra, RM-ANOVA può funzionare bene nella situazione più generale, quando il modello di additivo scritto sopra non regge .

Dichiarazione matematica precisa

Aggiungerò qui qualcosa tratto da Huynh & Feldt, 1970, Condizioni in base alle quali i rapporti quadrati medi nei disegni di misure ripetute hanno esatte distribuzioni -DF .

Cosa succede quando la sfericità si rompe?

Quando la sfericità non regge, possiamo probabilmente aspettarci che RM-ANOVA abbia (i) dimensioni gonfiate (più errori di tipo I), (ii) abbia una potenza ridotta (più errori di tipo II). Si può esplorare questo tramite simulazioni, ma non lo farò qui.


4

Si scopre che l'effetto della violazione della sfericità è una perdita di potenza (cioè una maggiore probabilità di un errore di tipo II) e una statistica di prova (rapporto F) che semplicemente non può essere confrontata con i valori tabulari della distribuzione F. Il test F diventa troppo liberale (cioè la percentuale di rifiuti dell'ipotesi nulla è maggiore del livello alfa quando l'ipotesi nulla è vera.

Sono molto coinvolte indagini precise su questo argomento, ma per fortuna Box et al hanno scritto un articolo al riguardo: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

In breve, la situazione è la seguente. Innanzitutto, supponiamo di avere un fattore di ripetizione delle misure con soggetti S e trattamenti sperimentali A In questo caso l'effetto della variabile indipendente viene testato calcolando la statistica F, che viene calcolata come il rapporto del quadrato medio dell'effetto dal quadrato medio dell'interazione tra il fattore soggetto e la variabile indipendente. Quando la sfericità è valida, queste statistiche hanno distribuzione Fisher con e υ 2 = ( A - 1 ) ( S - 1 ) gradi di libertà.υ1=UN-1υ2=(UN-1)(S-1)

Nel precedente articolo Box ha rivelato che quando la sfericità fallisce, il numero corretto di gradi di libertà diventa del rapporto F dipende da una sfericità ϵ in questo modo: υ 1 = ϵ ( A - 1 ) υ 2 = ϵ ( A - 1 ) ( S - 1 )υ1ε

υ1=ε(UN-1)
υ2=ε(UN-1)(S-1)

Inoltre Box ha introdotto l'indice di sfericità, che si applica alla matrice di covarianza della popolazione . Se chiamiamo le voci di questa tabella AxA, allora l'indice èξun',un'

ε=(Σun'ξun',un')2(UN-1)Σun',un''ξun',un''2

L'indice di sfericità di Box è meglio compreso in relazione agli autovalori di una matrice di covarianza. Ricordiamo che le matrici di covarianza appartengono alla classe delle matrici semi-definite positive e quindi hanno sempre positivi di autovalori nulli. Pertanto, la condizione di sfericità equivale ad avere tutti gli autovalori pari a una costante.

Quindi, quando viene violata la sfericità, dovremmo applicare alcune correzioni per le nostre statistiche F, e gli esempi più importanti di queste correzioni sono Greenhouse-Geisser e Huynh-Feldt, per esempio

Senza alcuna correzione i risultati saranno distorti e quindi inaffidabili. Spero che sia di aiuto!


+1. Commenterò più avanti, ma per ora il tuo primo paragrafo mescola la potenza e le dimensioni del test. Cosa è compromesso quando viene violata la sfericità? Il tasso di errore di tipo I sotto il null? O il potere? O entrambi? Probabilmente intendi entrambi, ma la formulazione non è molto chiara (penso). Inoltre, non è "Box et al", è solo Box :)
amoeba,

Penso che il potere sarà per lo più compromesso, perché come ha mostrato Box, quando viene violata la sfericità, dobbiamo fare affidamento su statistiche completamente diverse (con un altro grado di libertà). Se non ci basiamo su questo, allora in base alla forza della nostra violazione avremo una proporzione maggiore di rigetti dell'ipotesi nulla.
Vasto Accademico,

Scusa, ancora confuso, ora con il tuo commento: "maggior percentuale di rigetti del null" - intendi quando il null è effettivamente vero? Ma questo non ha nulla a che fare con il potere, questo è il tasso di errore di tipo I.
ameba,

+10. Attribuisco la mia generosità a questa risposta: è buona ed è anche l'unica risposta apparsa nel periodo di grazia. Non sono pienamente soddisfatto della tua risposta (ancora?) E ho iniziato a scrivere la mia risposta (attualmente incompleta, ma già pubblicata), ma ho solo una comprensione parziale della matematica sottostante. La tua risposta ha sicuramente aiutato e anche il riferimento al Box 1954 è molto utile.
ameba,

εεξUN×UN

1

yiojKio=1,...,io;j=1,...,J;K=1,...,K.

La media campionaria dell'i-esimo gruppo è

y¯io..=1JKΣj=1JΣK=1KyiojK

e quello dell'i-esimo argomento è

y¯ioj.=1KΣK=1KyiojK

Assumendo l'indipendenza tra i soggetti, la varianza della differenza tra due medie di gruppo è

Vun'r(y¯io..-y¯io'..)=1J2Σj=1JVun'r(y¯ioj.)+1J2Σj'=1JVun'r(y¯io'j'.)

Vun'r(y¯ioj.)σ2/Kσ2Vun'r(y¯ioj.)

Ora, alla domanda sulla sfericità sollevata.

y¯..K-y¯..K'

y¯..K=1ioJΣio=1ioΣj=1JyiojK.
yiojKyiojK' su tutti i soggetti. In particolare, sotto la consueta assunzione di indipendenza tra i soggetti,

Vun'r(y¯..K-y¯..K')=1(ioJ)2Σio=1ioΣj=1JVun'r(yiojK-yiojK')

Pertanto, assumendo una varianza costante di tutte le differenze a coppie, è valido eseguire un test t una volta stimata la varianza comune. Questo presupposto, insieme alla costante varianza di ogni osservazione, implica che la covarianza tra qualsiasi coppia di misurazioni è costante su tutte le coppie - Sergioha un ottimo post su questo argomento. Le ipotesi pertanto rendono una struttura varianza-covarianza per misurazioni ripetute di ciascun soggetto come una matrice con una costante in diagonale e un'altra costante in diagonale. Quando le voci fuori diagonale sono tutte pari a zero, si riduce al modello completamente indipendente (che potrebbe essere inappropriato per molti studi di misurazione ripetuti). Quando le voci fuori diagonale sono uguali a quelle diagonali, le misurazioni ripetute sono perfettamente correlate per un soggetto, il che significa che ogni singola misurazione è valida come tutte le misurazioni per ciascun soggetto. Nota finale: quando K = 2 nel nostro semplice disegno a trama divisa, la condizione di sfericità viene automaticamente soddisfatta.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.