Qual è l'ipotesi nulla di un MANOVA?


11

sfondo

Al fine di analizzare le differenze in alcune variabili continue tra diversi gruppi (fornite da una variabile categoriale), è possibile eseguire un ANOVA a senso unico. Se ci sono diverse variabili esplicative (categoriche), si può eseguire un ANOVA fattoriale. Se si desidera analizzare le differenze tra i gruppi in più variabili continue (ovvero diverse variabili di risposta), è necessario eseguire un ANOVA multivariato (MANOVA).

Domanda

Non capisco come si possa eseguire un test di tipo ANOVA su diverse variabili di risposta e, cosa ancora più importante, non capisco quale possa essere l'ipotesi nulla. È l'ipotesi nulla:

  • "Per ogni variabile di risposta, le medie di tutti i gruppi sono uguali",

o è

  • "Per almeno una variabile di risposta, le medie di tutti i gruppi sono uguali",

o è qualcos'altro?H0


Non posso dirlo, stai chiedendo anche come funziona un ANOVA? Nel contesto della discussione su cosa sia un errore standard, essenzialmente spiego qui l'idea di base dietro un ANOVA: come funziona l'errore standard?
gung - Ripristina Monica

Nessuna delle tue due dichiarazioni. H0di MANOVA è che non c'è differenza nello spazio multivariato . Il caso multivariato è considerevolmente più complesso che univariato perché dobbiamo fare i conti con le covarianze, non solo con le varianze. Esistono diversi modi per formulare le H0-H1ipotesi in MANOVA. Leggi Wikipedia.
ttnphns,

@ttnphns: Perché nessuno dei due? L' di ANOVA è che le medie di tutti i gruppi sono uguali. L' di MANOVA è che i mezzi multivariati di tutti i gruppi sono uguali. Questa è esattamente l'alternativa 1 nel PO. Covarianze ecc. Inseriscono le ipotesi e i calcoli di MANOVA, non l'ipotesi nulla. H 0H0H0
ameba dice di reintegrare Monica il

@amoeba, non mi è piaciuto For each response variable. Per me sembra (o l'ho letto come) "il test viene eseguito in modo univoco su ciascuno" (e quindi in qualche modo combinato).
ttnphns,

Risposte:


9

L'ipotesi nulla di un ANOVA a senso unico è che i mezzi di tutti i gruppi sono uguali:L'ipotesi nulla di un MANOVA a senso unico è che i mezzi [multivariati] di tutti i gruppi sono uguali:Ciò equivale a dire che i mezzi sono uguali per ogni variabile di risposta, cioè la tua prima opzione è corretta .H 0 : μ 1 = μ 2 = . . . = μ k . H 0H0

H0:μ1=μ2=...=μk.
H0
H0:μ1=μ2=...=μk.

In entrambi i casi l'ipotesi alternativa è la negazione del nulla. In entrambi i casi le ipotesi sono (a) distribuzioni gaussiane all'interno del gruppo e (b) varianze uguali (per ANOVA) / matrici di covarianza (per MANOVA) tra i gruppi.H1

Differenza tra MANOVA e ANOVA

Ciò potrebbe apparire un po 'confuso: l'ipotesi nulla di MANOVA è esattamente la stessa della combinazione di ipotesi null per una raccolta di ANOVA univariati, ma allo stesso tempo sappiamo che fare MANOVA non equivale a fare ANOVA univariati e poi in qualche modo " combinando "i risultati (si potrebbero trovare vari modi di combinare). Perchè no?

La risposta è che l'esecuzione di tutti gli ANOVA univariati, anche se testerebbe la stessa ipotesi nulla, avrà meno potere. Vedi la mia risposta qui per un'illustrazione: In che modo MANOVA può segnalare una differenza significativa quando nessuno degli ANOVA univariati raggiunge significato? Il metodo ingenuo di "combinazione" (rifiuta il null globale se almeno un ANOVA rifiuta il null) porterebbe anche a un'enorme inflazione del tasso di errore di tipo I; ma anche se si sceglie un modo intelligente di "combinare" per mantenere il corretto tasso di errore, si perderebbe il potere.

Come funziona il test

ANOVA decompone la somma dei quadrati in tra i gruppi somma dei quadrati e all'interno del gruppo somma dei quadrati , in modo che . Si calcola quindi il rapporto . Sotto l'ipotesi nulla, questo rapporto dovrebbe essere piccolo (circa ); si può calcolare l'esatta distribuzione di questo rapporto previsto sotto l'ipotesi nulla (dipenderà da e dal numero di gruppi). Confrontando il valore osservato con questa distribuzione si ottiene un valore p.TBWT=B+WB/W1nB/W

MANOVA decompone la dispersione totale matrice nel tra-rosata matrice e all'interno del gruppo scatter matrice , in modo che . Si calcola quindi la matrice . Sotto l'ipotesi nulla, questa matrice dovrebbe essere "piccola" (intorno a ); ma come quantificare quanto è "piccolo"? MANOVA osserva gli autovalori di questa matrice (sono tutti positivi). Ancora una volta, sotto l'ipotesi nulla, questi autovalori dovrebbero essere "piccoli" (intorno aTBWT=B+WW1BIλi1). Ma per calcolare un valore p, abbiamo bisogno di un numero (chiamato "statistica") per poterlo confrontare con la sua distribuzione prevista sotto il valore nullo. Esistono diversi modi per farlo: prendere la somma di tutti gli autovalori ; prende l'autovalore massimo , ecc. In ogni caso, questo numero viene confrontato con la distribuzione di questa quantità prevista sotto il valore null, risultante in un valore p.λimax{λi}

Scelte diverse della statistica del test portano a valori p leggermente diversi, ma è importante rendersi conto che in ogni caso viene testata la stessa ipotesi nulla.


Inoltre, se non si correggono i test multipli, l'approccio univariato degli ANOVA produrrà anche l'inflazione dell'errore di tipo I.
gung - Ripristina Monica

1
@gung: Sì, anche questo è vero. Tuttavia, si può essere più intelligenti nel "combinare" piuttosto che rifiutare il null non appena almeno uno degli ANOVA rifiuta il null. Il mio punto era che per quanto intelligente si cerchi di "combinare", si perderà comunque la potenza rispetto a MANOVA (anche se si riuscirà a mantenere le dimensioni del test senza gonfiare il tasso di errore).
ameba dice di reintegrare Monica il

Ma ora quel "potere" non è direttamente correlato alla nozione di covarianza? La morale è che con una (serie di) test univariato testiamo solo l'effetto marginale che è SSdifference/SSerrorscalare. In MANOVA l'effetto multivariato è SSCPerror^(-1)SSCPdifferencematrice (totale covarianze e all'interno dei gruppi rappresentati). Ma dal momento che ci sono diversi autovalori che potrebbero essere "combinati" non in una sola maniera in una statistica di prova, esistono diverse possibili ipotesi alternative. Più potenza - più complessità teorica.
ttnphns,

@ttnphns, sì, è tutto corretto, ma penso che non cambi il fatto che l'ipotesi nulla sia ciò che ho scritto (ed è di questo che si trattava). Qualunque sia la statistica del test utilizzata (Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling), stanno cercando di verificare la stessa ipotesi nulla. Potrei espandere la mia risposta in seguito per discuterne in modo più dettagliato.
ameba dice di reintegrare Monica il

1
@gung mi ha chiesto di entrare (non so perché ... ho insegnato a MANOVA circa 7 anni fa e non l'ho mai applicato) - Direi che l'ameba ha ragione nel dire che è una negazione totale del nulla , che è un iperspazio tridimensionale nello spazio dimensionale dei parametri (se è la dimensione che nessuno si è preoccupato di definire finora) . Ed è l'opzione 1 fornita dall'OP. L'opzione 2 è significativamente più difficile da testare. H1H0:μgroup 1==μgroup kpkpp
Attacca il

8

È il primo.

Tuttavia, il modo in cui lo fa non è letteralmente confrontare a turno le medie di ciascuna delle variabili originali. Invece le variabili di risposta vengono trasformate linearmente in un modo molto simile all'analisi dei componenti principali . (C'è un eccellente thread su PCA qui: dare un senso all'analisi dei componenti principali, autovettori e autovalori .) La differenza è che PCA orienta i tuoi assi in modo da allinearli con le direzioni di variazione massima, mentre MANOVA ruota i tuoi assi nelle direzioni che massimizza la separazione dei tuoi gruppi.

Per essere chiari, tuttavia, nessuno dei test associati a un MANOVA sta testando tutti i mezzi uno dopo l'altro in un senso diretto, sia con i mezzi nello spazio originale che nello spazio trasformato. Esistono diverse statistiche di test diverse, ognuna delle quali funziona in modo leggermente diverso, tuttavia tende ad operare sugli autovalori della decomposizione che trasforma lo spazio. Ma per quanto riguarda la natura dell'ipotesi nulla, è che tutti i mezzi di tutti i gruppi sono uguali su ciascuna variabile di risposta, non che possono differire su alcune variabili ma sono uguali su almeno una.


Ooh ... Quindi Manova fa un'analisi discriminante lineare (per massimizzare la distanza tra la media dei gruppi) e poi, esegue un'anova standard usando il primo asse come variabile di risposta? Quindi, è "il mezzo - in termini di PC1 - di tutti i gruppi sono gli stessi". È giusto? Ho
Remi.b,

Esistono diversi test possibili. Testare solo il 1 ° asse utilizza essenzialmente la radice più grande di Roy come test. Questo sarà spesso il test più potente, ma è anche più limitato. Sono d'accordo che è in corso una discussione su quale test sia "migliore".
gung - Ripristina Monica

Immagino che usiamo MANOVA piuttosto che diversi ANOVA per evitare molteplici problemi di test. Ma se, facendo un MANOVA, realizziamo un ANOVA su PC1 di un LDR , allora abbiamo ancora un problema di test multipli da considerare quando guardiamo il Pvalue. È giusto? (Spero che abbia più senso. Ho cancellato il mio precedente commento poco chiaro)
Remi.b

Questo è un punto perspicace, ma ci sono due problemi: 1) gli assi sono ora ortogonali e questo può cambiare i problemi con i test multipli; 2) le distribuzioni campionarie delle statistiche dei test MANOVA tengono conto degli assi multipli.
gung - Ripristina Monica

1
@ Remi.b: queste sono buone domande, ma solo per essere chiari: MANOVA non è equivalente a un ANOVA sul primo asse discriminante di LDA! Vedi qui per una relazione tra MANOVA e LDA: in che modo MANOVA è correlato a LDA?
ameba dice di reintegrare Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.