Come visualizzare cosa fa ANOVA?


60

In che modo (modi?) Esiste per spiegare visivamente cos'è ANOVA?

Eventuali riferimenti, link (s) (pacchetti R?) Saranno i benvenuti.


Nel suo blog "Gli sforzi di uno psicologo nella programmazione statistica" Kristoffer Magnusson fornisce un ottimo esempio di visualizzazione anova a senso unico utilizzando D3.js rpsychologist.com/d3-one-way-anova/#comment-1891
Epifunky

Ho trovato questa bella visualizzazione di cosa sia l'analisi della varianza. Non è preciso come le risposte precedenti, ma puoi giocare interattivamente con la visualizzazione. L'ho trovato abbastanza interessante: students.brown.edu/seeing-theory/regression/index.html#third
Mike

Risposte:


51

Personalmente, mi piace introdurre la regressione lineare e ANOVA dimostrando che è tutto uguale e che i modelli lineari equivalgono a suddividere la varianza totale: abbiamo un qualche tipo di varianza nei risultati che può essere spiegata dai fattori di interesse, oltre a quelli inspiegabili parte (chiamato "residuo"). In genere utilizzo la seguente illustrazione (linea grigia per la variabilità totale, linee nere per la variabilità specifica di gruppo o individuale):

testo alternativo

Mi piace anche il heplots pacchetto R, da Michael amichevole e John Fox, ma vedo anche test di ipotesi visive in modelli multivariati lineari: il pacchetto heplots per R .

I modi standard per spiegare cosa fa effettivamente ANOVA, specialmente nel modello lineare, sono davvero ben spiegati nelle risposte piane a domande complesse , di Christensen, ma ci sono pochissime illustrazioni. Metodi statistici di Saville e Wood : l'approccio geometrico ha alcuni esempi, ma principalmente sulla regressione. In Montgomery's Design and Analysis of Experiments , che si concentra principalmente sul DoE, ci sono illustrazioni che mi piacciono, ma vedi sotto

testo alternativo

(questi sono miei :-)

Ma penso che devi cercare libri di testo su Modelli lineari se vuoi vedere come la somma di quadrati, errori, ecc. Si traduce in uno spazio vettoriale, come mostrato su Wikipedia . Estimation and Inference in Econometrics , di Davidson e MacKinnon, sembra avere delle belle illustrazioni (il primo capitolo riguarda in realtà la geometria OLS) ma sfoglio solo la traduzione in francese (disponibile qui ). La geometria della regressione lineare ha anche alcune buone illustrazioni.

Modifica :

Ah, e ricordo solo questo articolo di Robert Pruzek, Una nuova grafica per ANOVA a senso unico .

Modifica 2

E ora, il pacchetto granova (menzionato da @ gd047 e associato al documento sopra) è stato portato su ggplot, vedere granovaGG con un'illustrazione per ANOVA a senso unico di seguito.

inserisci qui la descrizione dell'immagine


La prima illustrazione è prodotta usando R?
George Dontas,

@ gd047 Sì. Dovresti avere il brutto codice sorgente da qualche parte se vuoi. Il secondo è fatto in Metapost.
chl

3
@ gd047 Va bene, come sempre è quando cerchiamo il vecchio codice che non riusciamo a trovarlo (nonostante il mio miglior sforzo con grep / find), quindi ho riscritto un veloce (ancora brutto) script R per quello. Ho anche messo un esempio del codice MP .
chl

La geometria del collegamento di regressione lineare sembra marcire, purtroppo.
Silverfish

23

Che ne dici di questo? testo alternativo

A seguito di Crawley (2005). Statistiche. Un'introduzione usando R: Wiley.


1
(+1) Mi ricordo di plot.design()(ma il tuo in una versione migliorata :-)
chl

Questo è il migliore.
Curioso

13

Grazie per la tua grande risposta finora. Mentre erano molto illuminanti, ho sentito che usarli per il corso che sto insegnando (beh, TA'ing) sarebbe troppo per i miei studenti. (Aiuto a insegnare il corso BioStatistics per studenti di laurea specialistica in scienze della medicina)

Pertanto, ho finito per creare due immagini (entrambe basate sulla simulazione) che ritengo siano un utile esempio per spiegare ANOVA.

Sarei felice di leggere commenti o suggerimenti per migliorarli.

La prima immagine mostra una simulazione di 30 punti dati, separati da 3 grafici (che mostra come MST = Var è separato dai dati che creano MSB e MSW:

  • Il diagramma a sinistra mostra un diagramma a dispersione dei dati per gruppo.
  • Quello centrale mostra come saranno i dati che useremo per MSB.
  • L'immagine a destra mostra l'aspetto dei dati che utilizzeremo per MSW.

testo alternativo

La seconda immagine mostra 4 grafici, ognuno per una diversa combinazione di varianza e aspettativa per i gruppi mentre

  • La prima riga di grafici è per varianza bassa, mentre la seconda riga è per varianza alta.
  • La prima colonna di grafici è per la stessa aspettativa tra i gruppi, mentre la seconda colonna mostra i gruppi con aspettative (molto) diverse.

testo alternativo


2
(+1) Penso sempre che i messaggi da asporto durante l'insegnamento di ANOVA siano: (1) abbiamo un rapporto F che riflette l'importanza relativa della varianza spiegata dal nostro fattore di interesse. varianza totale (o MSB / MSW dove MSW = MST-MSB), (2) le differenze tra il gruppo significa è una varianza e (3) esplicitamente vs . ( ). Se sei in grado di trasmettere quelle idee in un display grafico - che sembra essere il caso qui--, allora penso che tu abbia quasi finito. H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0
chl

Ciao chl, grazie per il feedback positivo (e per la tua precedente risposta dettagliata)! Penso che alcuni dei più grandi massaggi da portare a casa che ho ottenuto dalla preparazione del materiale per questa classe siano: 1) Come descrivere la trasformazione dei dati originali in modo da ottenere le misure di varianza tra MSB e MSW. 2) In che modo la statistica test di MSB / MSW è in realtà un test unilaterale (non un fronte / retro) in cui H0 è tale MSB <= MSW. Infine, ho solo pensato di notare che è vero che SSW = SST-SSB (ma non vedo quanto sia vero per MSW = MST-MSB).
Tal Galili,

1
Sì, mi dispiace di aver scritto in fretta. Intendevo: considerazione il modello o ed evidenziare graficamente la seguente decomposizione: , ovvero obs. sono espressi come deviazioni dalla media grande + media di gruppo + fluttuazioni attorno alla media di gruppo. Quindi, abbiamo o variazione totale = tra variazione del gruppo + variazione all'interno del gruppo (che è fondamentalmente la tua prima immagine). yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)
chl

12

Dato che in questo post raccogliamo alcuni tipi di bei grafici, eccone un altro che ho scoperto di recente e che può aiutarti a capire come funziona ANOVA e come viene generata la statistica F. L'immagine è stata creata usando il pacchetto granova in R. testo alternativo


2
(+1) Ho fornito un link all'articolo di Robert Pruzek, ma non sapevo che fosse disponibile in R.
chl l'

10

Dai un'occhiata alla presentazione di Hadley Wickham ( pdf , mirror ) su ggplot. A partire dalle pagine 23-40 di questo documento descrive un approccio interessante alla visualizzazione degli ANOVA.

* Link tratto da: http://had.co.nz/ggplot2/


6

Ottima domanda Sai, ho lottato con me stesso per avvolgere la testa attorno ad ANOVA per molto tempo. Mi ritrovo sempre a tornare all'intuizione "tra contro contro dentro" e ho sempre cercato di immaginare come sarebbe stato questo nella mia testa. Sono contento che questa domanda sia emersa, e sono stato sorpreso dai vari approcci a questo nelle risposte sopra.

Ad ogni modo, per molto tempo (anni, anche) ho voluto raccogliere diverse trame in un posto dove ho potuto vedere cosa stava succedendo simultaneamente da molte direzioni diverse: 1) quanto distano le popolazioni , 2) come molto distanti i dati , 3) quanto è grande il rapporto tra l' interno e 4) come si confrontano le distribuzioni F centrale e non centrale ?

In un mondo davvero fantastico , potrei persino giocare con i cursori per vedere come le dimensioni del campione cambiano le cose.

Quindi ho giocato con il manipulatecomando in RStudio , e Holy Cow, funziona! Ecco una delle trame, un'istantanea, davvero:

visualizeANOVA

Se hai RStudio puoi ottenere il codice per creare la trama sopra (cursori e tutti)! su Github qui .

Dopo aver giocato con questo per un po ', sono sorpreso dal modo in cui la statistica F distingue i gruppi, anche per campioni di dimensioni moderatamente piccole. Quando guardo le popolazioni, in realtà non sono così distanti (ai miei occhi), tuttavia, la barra "all'interno" è costantemente sminuita dalla barra "tra". Impara qualcosa ogni giorno, immagino.


3

Per illustrare cosa sta succedendo con l'ANOVA a senso unico, a volte ho usato un'applet offerta dagli autori di "Introduzione alla pratica della statistica", che consente agli studenti di giocare con varianze all'interno e tra e osservare il loro effetto sulla statistica F . Ecco il link (l'applet è l'ultimo sulla pagina). Schermata di esempio:

inserisci qui la descrizione dell'immagine

L'utente controlla il dispositivo di scorrimento superiore, variando gli spread verticali dei tre gruppi di dati. Il punto rosso in basso si sposta lungo il grafico dei valori p mentre la statistica F mostrata sotto viene aggiornata.


2

Sembra che la nave abbia già navigato in termini di risposta, ma penso che se questo è un corso introduttivo che la maggior parte dei display offerti qui sarà troppo difficile da comprendere per gli studenti introduttivi ... o almeno difficile da comprendere senza un display introduttivo che fornisce una spiegazione molto semplificata della varianza del partizionamento. Mostra loro come il totale SST aumenta con il numero di soggetti. Quindi, dopo averlo mostrato, gonfia per diversi soggetti (magari aggiungendone uno in ciascun gruppo più volte), spiega che SST = SSB + SSW (anche se preferisco chiamarlo SSE fin dall'inizio perché evita la confusione quando vai al test IMO all'interno dei soggetti ). Quindi mostra loro una rappresentazione visiva del partizionamento della varianza, ad esempio un grande colore quadrato codificato in modo tale da poter vedere come SST è fatto di SSB e SSW. Poi,


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.