In che modo (modi?) Esiste per spiegare visivamente cos'è ANOVA?
Eventuali riferimenti, link (s) (pacchetti R?) Saranno i benvenuti.
In che modo (modi?) Esiste per spiegare visivamente cos'è ANOVA?
Eventuali riferimenti, link (s) (pacchetti R?) Saranno i benvenuti.
Risposte:
Personalmente, mi piace introdurre la regressione lineare e ANOVA dimostrando che è tutto uguale e che i modelli lineari equivalgono a suddividere la varianza totale: abbiamo un qualche tipo di varianza nei risultati che può essere spiegata dai fattori di interesse, oltre a quelli inspiegabili parte (chiamato "residuo"). In genere utilizzo la seguente illustrazione (linea grigia per la variabilità totale, linee nere per la variabilità specifica di gruppo o individuale):
Mi piace anche il heplots pacchetto R, da Michael amichevole e John Fox, ma vedo anche test di ipotesi visive in modelli multivariati lineari: il pacchetto heplots per R .
I modi standard per spiegare cosa fa effettivamente ANOVA, specialmente nel modello lineare, sono davvero ben spiegati nelle risposte piane a domande complesse , di Christensen, ma ci sono pochissime illustrazioni. Metodi statistici di Saville e Wood : l'approccio geometrico ha alcuni esempi, ma principalmente sulla regressione. In Montgomery's Design and Analysis of Experiments , che si concentra principalmente sul DoE, ci sono illustrazioni che mi piacciono, ma vedi sotto
(questi sono miei :-)
Ma penso che devi cercare libri di testo su Modelli lineari se vuoi vedere come la somma di quadrati, errori, ecc. Si traduce in uno spazio vettoriale, come mostrato su Wikipedia . Estimation and Inference in Econometrics , di Davidson e MacKinnon, sembra avere delle belle illustrazioni (il primo capitolo riguarda in realtà la geometria OLS) ma sfoglio solo la traduzione in francese (disponibile qui ). La geometria della regressione lineare ha anche alcune buone illustrazioni.
Modifica :
Ah, e ricordo solo questo articolo di Robert Pruzek, Una nuova grafica per ANOVA a senso unico .
Modifica 2
E ora, il pacchetto granova (menzionato da @ gd047 e associato al documento sopra) è stato portato su ggplot, vedere granovaGG con un'illustrazione per ANOVA a senso unico di seguito.
Grazie per la tua grande risposta finora. Mentre erano molto illuminanti, ho sentito che usarli per il corso che sto insegnando (beh, TA'ing) sarebbe troppo per i miei studenti. (Aiuto a insegnare il corso BioStatistics per studenti di laurea specialistica in scienze della medicina)
Pertanto, ho finito per creare due immagini (entrambe basate sulla simulazione) che ritengo siano un utile esempio per spiegare ANOVA.
Sarei felice di leggere commenti o suggerimenti per migliorarli.
La prima immagine mostra una simulazione di 30 punti dati, separati da 3 grafici (che mostra come MST = Var è separato dai dati che creano MSB e MSW:
La seconda immagine mostra 4 grafici, ognuno per una diversa combinazione di varianza e aspettativa per i gruppi mentre
Dato che in questo post raccogliamo alcuni tipi di bei grafici, eccone un altro che ho scoperto di recente e che può aiutarti a capire come funziona ANOVA e come viene generata la statistica F. L'immagine è stata creata usando il pacchetto granova in R.
Dai un'occhiata alla presentazione di Hadley Wickham ( pdf , mirror ) su ggplot. A partire dalle pagine 23-40 di questo documento descrive un approccio interessante alla visualizzazione degli ANOVA.
* Link tratto da: http://had.co.nz/ggplot2/
Ottima domanda Sai, ho lottato con me stesso per avvolgere la testa attorno ad ANOVA per molto tempo. Mi ritrovo sempre a tornare all'intuizione "tra contro contro dentro" e ho sempre cercato di immaginare come sarebbe stato questo nella mia testa. Sono contento che questa domanda sia emersa, e sono stato sorpreso dai vari approcci a questo nelle risposte sopra.
Ad ogni modo, per molto tempo (anni, anche) ho voluto raccogliere diverse trame in un posto dove ho potuto vedere cosa stava succedendo simultaneamente da molte direzioni diverse: 1) quanto distano le popolazioni , 2) come molto distanti i dati , 3) quanto è grande il rapporto tra l' interno e 4) come si confrontano le distribuzioni F centrale e non centrale ?
In un mondo davvero fantastico , potrei persino giocare con i cursori per vedere come le dimensioni del campione cambiano le cose.
Quindi ho giocato con il manipulate
comando in RStudio , e Holy Cow, funziona! Ecco una delle trame, un'istantanea, davvero:
Se hai RStudio puoi ottenere il codice per creare la trama sopra (cursori e tutti)! su Github qui .
Dopo aver giocato con questo per un po ', sono sorpreso dal modo in cui la statistica F distingue i gruppi, anche per campioni di dimensioni moderatamente piccole. Quando guardo le popolazioni, in realtà non sono così distanti (ai miei occhi), tuttavia, la barra "all'interno" è costantemente sminuita dalla barra "tra". Impara qualcosa ogni giorno, immagino.
Per illustrare cosa sta succedendo con l'ANOVA a senso unico, a volte ho usato un'applet offerta dagli autori di "Introduzione alla pratica della statistica", che consente agli studenti di giocare con varianze all'interno e tra e osservare il loro effetto sulla statistica F . Ecco il link (l'applet è l'ultimo sulla pagina). Schermata di esempio:
L'utente controlla il dispositivo di scorrimento superiore, variando gli spread verticali dei tre gruppi di dati. Il punto rosso in basso si sposta lungo il grafico dei valori p mentre la statistica F mostrata sotto viene aggiornata.
Sembra che la nave abbia già navigato in termini di risposta, ma penso che se questo è un corso introduttivo che la maggior parte dei display offerti qui sarà troppo difficile da comprendere per gli studenti introduttivi ... o almeno difficile da comprendere senza un display introduttivo che fornisce una spiegazione molto semplificata della varianza del partizionamento. Mostra loro come il totale SST aumenta con il numero di soggetti. Quindi, dopo averlo mostrato, gonfia per diversi soggetti (magari aggiungendone uno in ciascun gruppo più volte), spiega che SST = SSB + SSW (anche se preferisco chiamarlo SSE fin dall'inizio perché evita la confusione quando vai al test IMO all'interno dei soggetti ). Quindi mostra loro una rappresentazione visiva del partizionamento della varianza, ad esempio un grande colore quadrato codificato in modo tale da poter vedere come SST è fatto di SSB e SSW. Poi,