Posso fidarmi dei risultati ANOVA per un DV non distribuito normalmente?


22

Ho analizzato un esperimento con ANOVA misure ripetute. L'ANOVA è un 3x2x2x2x3 con 2 fattori tra soggetti e 3 all'interno (N = 189). Il tasso di errore è la variabile dipendente. La distribuzione dei tassi di errore ha un'inclinazione di 3,64 e una curtosi di 15,75. L'inclinazione e la curtosi sono il risultato del 90% del tasso di errore significa essere 0. Leggere alcuni dei precedenti thread sui test di normalità qui mi ha un po 'confuso. Ho pensato che se avessi dati che non erano normalmente distribuiti, era nel tuo interesse trasformarli se possibile, ma sembra che molte persone pensino che l'analisi di dati non normali con un ANOVA o un test T sia accettabile. Posso fidarmi dei risultati dell'ANOVA?

(A proposito, in futuro intendo analizzare questo tipo di dati in R con modelli misti con una distribuzione binomiale)


1
Potresti collegarti ad alcuni di quei thread? Il mio istinto è "NOOO no no no", ma difficilmente sono un esperto e sarei interessato a leggere alcuni di questi argomenti.
Matt Parker,

4
Di certo non puoi fidarti di nessun valore p derivato dalle distribuzioni F con questo tipo di dati!
whuber

3
Molti citano la solidità dell'ANOVA come giustificazione per l'utilizzo con dati non normali. IMHO, la robustezza non è un attributo generale di un test, ma devi affermare con precisione a) contro quali violazioni dei suoi presupposti un test è robusto (normalità, sfericità, ...), b) fino a che punto queste violazioni non hanno grandi effetto, c) quali sono i prerequisiti affinché il test mostri robustezza (dimensioni delle celle grandi e uguali ...). Nel tuo progetto a trama divisa, mi piacerebbe che qualcuno affermasse i precisi presupposti di sfericità e uguaglianza delle matrici di covarianza. È già sbalorditivo nel caso 2 fattoriale.
Caracal,

3
@Matt Sembra che il 90% dei residui sia zero. In tal caso, nessuna trasformazione renderà i residui in remoto vicini alla normalità. Gli studi di simulazione hanno dimostrato che i valori p dei test F sono altamente sensibili alle deviazioni dalla normalità. (Nel tuo caso è abbastanza probabile che alcuni denominatori nei test F siano zero: un indicatore acuto di quanto le cose possono andare storte.) È necessario un approccio diverso. Cosa fare dipende dal motivo per cui così tanti residui sono zero. Mancanza di precisione sufficiente nelle misurazioni?
whuber

2
@Matt che sembra più appropriato, supponendo che i tuoi dati siano conteggi. Un'altra considerazione interessante è una risposta binomiale negativa zero inflazionata ( ats.ucla.edu/stat/r/dae/zinbreg.htm ).
whuber

Risposte:


20

Come altri test parametrici, l'analisi della varianza presuppone che i dati si adattino alla distribuzione normale. Se la variabile di misurazione non viene normalmente distribuita, è possibile che si aumentino le possibilità di un risultato falso positivo se si analizzano i dati con un'anova o un altro test che presuppone la normalità. Fortunatamente, un'anova non è molto sensibile alle moderate deviazioni dalla normalità; studi di simulazione, usando una varietà di distribuzioni non normali, hanno dimostrato che il tasso di falsi positivi non è influenzato molto da questa violazione del presupposto (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Questo perché quando si preleva un gran numero di campioni casuali da una popolazione, i mezzi di tali campioni sono distribuiti approssimativamente normalmente anche quando la popolazione non è normale.

È possibile testare la bontà di adattamento di un set di dati alla distribuzione normale. Non suggerisco di farlo, perché molti set di dati che sono significativamente non normali sarebbero perfettamente appropriati per un'anova.

Invece, se hai un set di dati abbastanza grande, ti suggerisco di dare un'occhiata all'istogramma della frequenza. Se sembra più o meno normale, vai avanti ed esegui un'anova. Se sembra una distribuzione normale che è stata spostata su un lato, come i dati sul solfato sopra, dovresti provare diverse trasformazioni di dati e vedere se qualcuno di loro rende l'istogramma più normale. Se ciò non funziona e i dati sembrano ancora gravemente non normali, probabilmente è ancora bene analizzare i dati utilizzando un'anova. Tuttavia, potresti voler analizzarlo usando un test non parametrico. Quasi ogni test statistico parametrico ha un sostituto non parametrico, come il test Kruskal – Wallis invece di un'anova unidirezionale, Wilcoxon test di livello firmato invece di un t-test accoppiato e Spearman classifica correlazione invece di regressione lineare. Questi test non parametrici non presuppongono che i dati si adattino alla distribuzione normale. Presumono tuttavia che i dati in gruppi diversi abbiano la stessa distribuzione reciproca; se gruppi diversi hanno distribuzioni di forma diversa (ad esempio, uno è inclinato a sinistra, un altro è inclinato a destra), un test non parametrico potrebbe non essere migliore di uno parametrico.

Riferimenti

  1. Glass, GV, PD Peckham e JR Sanders. 1972. Conseguenze del mancato rispetto delle ipotesi alla base dell'analisi degli effetti fissi di varianza e covarianza. Rev. Educ. Res. 42: 237-288.
  2. Harwell, MR, EN Rubinstein, WS Hayes e CC Olds. 1992. Riassumendo i risultati di Monte Carlo nella ricerca metodologica: i casi ANOVA a effetti fissi a uno e due fattori. J. Educ. Statistica. 17: 315-339.
  3. Lix, LM, JC Keselman e HJ Keselman. 1996. Conseguenze delle violazioni del presupposto rivisitate: una revisione quantitativa delle alternative all'analisi unidirezionale del test di varianza F. Rev. Educ. Res. 66: 579-619.

7
Potrei solo mostrare la mia ignoranza qui, ma non è il presupposto dietro ANOVA che i residui sono normali? In tal caso, non importa se la variabile stessa non è normale, purché i residui si adattino al modello.
richiemorrisroe,

5
Forse la domanda è stata modificata, ma davvero non capisco perché questa risposta sia stata votata e accettata. È un consiglio generale decente, ma non ha quasi nulla a che fare con questo caso particolare di "L'inclinazione e la curtosi sono il risultato del 90% del tasso di errore significa essere 0". In questo caso la risposta dovrebbe essere no, no e no.
Erik,

8

Specificamente per quanto riguarda i tassi di errore come DV, Dixon (2008) dimostra in modo molto convincente che il test delle ipotesi nulle tramite ANOVA può causare sia tassi di falsi allarmi aumentati (chiamando effetti "significativi" quando non lo sono) sia tassi di miss maggiori (effetti reali mancanti). Dimostra anche che la modellazione di effetti misti, specificando l'errore distribuito binomialmente, è l'approccio più appropriato all'analisi dei dati di velocità.


4

Non puoi fidarti del tuo ANOVA con così tanto disallineamento e un gran numero di 0. Un metodo più appropriato sarebbe quello di utilizzare il numero di errori come DV (trasformando così il DV in dati di conteggio) e fare un'analisi di Poisson. Questo approccio richiederebbe l'utilizzo di un'analisi di effetti misti e la specifica della famiglia di distribuzione degli errori come Poisson. L'articolo di Dixon (2008) * menzionato da Mike Lawrence utilizza l'analisi di effetti misti in R ma con esiti binomiali. Mi sono completamente spostato a fare R per la maggior parte delle mie analisi di misure ripetute perché così tante delle mie variabili di risultato sono binomiali. Il pacchetto R appropriato è lme4.

*


2

Juan ha offerto molto, anche se farò eco agli altri e ripeterò che per la massima precisione le variabili stesse possono essere non normali fintanto che i loro residui non lo sono. Inoltre, su yellowbrickstats.com è disponibile una risposta semplificata e leggermente più strutturata (tramite un diagramma di flusso con annotazioni) .


1
Scusa, ma -1 da parte mia. Questo è vero in generale, ma i residui non lo saranno se abbiamo un'inflazione di zeri. Penso che le risposte non debbano riguardare solo le generalità, ma risolvere il problema specifico.
Erik,

1

Gli effetti del soffitto sono il problema qui. Un test non parametrico è la scommessa più sicura, sebbene gli ANOVA siano robusti a questa violazione della normalità se n è grande. In genere le persone usano solo un istogramma per testarlo, ma se il problema riguarda i residui potrebbe essere più avanzato di così. Tieni anche presente come ciò influisce sui risultati (non solo sul fatto). Pallant (2007) probabilmente direbbe che questo aumenta le possibilità di errore di tipo uno, quindi se riduci l'alfa critica lo mitighi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.