Cheat Sheet ANOVA Alphabet Soup & Regression Equivalents


18

Posso ottenere aiuto per completare questo tentativo (in corso) tentativo di orientarmi sugli equivalenti ANOVA e REGRESSION? Ho cercato di conciliare concetti, nomenclatura e sintassi di queste due metodologie. Ci sono molti post su questo sito sulla loro comunanza, per esempio questo o questo , ma è comunque utile avere una rapida mappa "sei qui" all'inizio.

Ho intenzione di aggiornare questo post e spero di ricevere aiuto per correggere errori.

ANOVA a senso unico:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

ANOVA a due vie:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANOVA fattoriale bidirezionale:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

ALL'INTERNO DEL FATTORE (o SOGGETTO) ANOVA: ( codificare qui )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( codice qui )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

DESIGN NESTATO: ( codice qui )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

SITI UTILI:

  1. RExRepos
  2. Progetto di personalità
  3. Quick-R
  4. R Bloggers
  5. Analisi annidata e diagramma diviso di M. Crawley
  6. Modelli con effetti casuali multipli
  7. Modelli di grafici divisi
  8. Il libro R di M. Crawley
  9. All'interno di gruppi e misure ripetute
  10. Ripetere le misure in R
  11. FAQ GLMM

Una nota: per i tuoi esempi ANOVA a 2 vie (semplice e fattoriale) il tuo scenario / sintassi è cyl + hp. L'Horespower è continuo, quindi non funziona qui. carb, il numero di carburatori sarebbe una scelta migliore.
Gregor --state Monica

Grazie! Errore sbadato. Grazie alla tua nota ho anche rilevato dei cilindri trattati come continui, quindi l'ho cambiato come fattore. E ho incluso TukeyHSD.
Antoni Parellada,

1
Penso che dovresti eliminare 'Survival' dal titolo in quanto si tratta di un'area molto specifica di statistiche completamente estranea a ciò che stai (molto bene) riassumendo.
Bryan Hanson,

Bel riassunto Antoni! Forse potresti anche aggiungere i glmmFAQ di Ben Bolker e forse alcuni semplici esempi binomiali e di Poisson (GLM e GLMM). Ma capisco che questo può complicare troppo le cose e toglie questo riassunto piacevole e conciso. In alternativa è possibile collegare ad esempi su questo sito. Per un semplice esempio binomiale Poisson / negativo completo potrebbe funzionare: stats.stackexchange.com/questions/325334/…
Stefan

Risposte:


2

Bella lista, Antoni. Ecco alcuni suggerimenti minori:

ANOVA a una via: IV è un FATTORE con 3 o più livelli. Puoi anche aggiungere un esempio di dati: mtcars a questa voce. (Allo stesso modo, è possibile aggiungere istruzioni "Esempio di dati" a tutte le voci, per chiarire quali set di dati si stanno utilizzando.)

Anova a due vie: perché non usare IV1 e IV2 e affermare che le due variabili indipendenti dovrebbero essere fattori con almeno due livelli ciascuno? Il modo in cui lo hai affermato attualmente suggerisce che un'anova a due vie potrebbe includere più di 2 variabili (o fattori) indipendenti, il che non è sensato.

Per Anova a due vie, distinguerei tra questi due sotto-casi: 1. Anova a due vie con effetti principali per IV1 e IV2 e 2. Anova a due vie con un'interazione tra IV1 e IV2. Questo secondo elemento è ciò che si sta riferendo a due come un'anova bidirezionale fattoriale.) Un modo migliore per descrivere questi due sotto-casi sarebbe: 1. L'effetto di IV1 su DV è indipendente dall'effetto di IV2 e 2. Effetto di IV1 su DV dipende da IV2. Si potrebbe anche chiarire che sono le variabili indipendenti IV1 e IV2 che sono codificate fittizie nell'impostazione di regressione.

Per ANCOVA, potresti chiarire che stai prendendo in considerazione solo ANCOVA a senso unico nel tuo esempio attuale. Per completezza, è possibile aggiungere un esempio ANCOVA a due vie senza interazioni tra IV1 e IV2 e uno con l'interazione tra queste due variabili.

Per tutto quanto sopra, è anche possibile aggiungere un elemento chiamato Scopo , che descrive quando queste analisi sono utili. Per esempio:

Scopo (dell'anova a senso unico): indagare se i valori medi del DV sono diversi tra i livelli del IV.

Per MANOVA, puoi chiarire che sarebbero necessari (a) due o più DV e (2) uno o più IV che sono fattori? Suppongo che tu possa distinguere tra MANOVA a una via (con 1 fattore) e MANOVA a due vie? Stessa cosa per MANCOVA.

L'ANOVA WITHIN-FACTOR è anche nota come ANOVA MISURE RIPETUTE, quindi forse puoi aggiungere questa terminologia al tuo elenco per coloro che hanno familiarità con essa. Sarebbe anche utile chiarire che la modellazione di effetti misti fornisce un modo alternativo per modellare dati di misure ripetute. Altrimenti, i lettori potrebbero non apprezzare la differenza tra i due approcci.


È più facile per me fornire suggerimenti piuttosto che apportare modifiche.🤗
Isabella Ghement
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.