Dovrei includere un argomento per richiedere somme di quadrati di tipo III in ezANOVA?


16

Ho sviluppato il pacchetto ez per R come mezzo per aiutare le persone a passare da pacchetti di statistiche come SPSS a R. Questo è (si spera) ottenuto semplificando le specifiche di vari tipi di ANOVA e fornendo output simili a SPSS (inclusi dimensioni degli effetti e ipotesi test), tra le altre caratteristiche. La ezANOVA()funzione serve principalmente come wrapper car::Anova(), ma la versione attuale ezANOVA()implementa solo somme di quadrati di tipo II, mentre car::Anova()consente la specifica di somme di tipo II o -III di quadrati. Come forse avrei dovuto aspettarmi, diversi utenti hanno richiesto di fornire un argomento inezANOVA()che consente all'utente di richiedere il tipo II o il tipo III. Sono stato reticente a farlo e ho delineato il mio ragionamento di seguito, ma apprezzerei il contributo della comunità sul mio o qualsiasi altro ragionamento che affronta il problema.

Motivi per non includere un argomento "SS_type" inezANOVA() :

  1. La differenza tra i quadrati di somma di tipo I, II e III aumenta solo quando i dati sono sbilanciati, nel qual caso direi che maggiori benefici derivano dal miglioramento dello squilibrio da un'ulteriore raccolta di dati che dalla manipolazione del calcolo ANOVA.
  2. La differenza tra il tipo II e III si applica agli effetti di ordine inferiore che sono qualificati da effetti di ordine superiore, nel qual caso considero scientificamente poco interessanti gli effetti di ordine inferiore. (Ma vedi sotto per la possibile complicazione dell'argomento)
  3. Per quelle rare circostanze in cui (1) e (2) non si applicano (quando un'ulteriore raccolta di dati è impossibile e il ricercatore ha un interesse scientifico valido in un effetto principale qualificato che attualmente non riesco a immaginare), si può facilmente modificare la ezANOVA()fonte o impiegarecar::Anova() per ottenere prove di tipo III. In questo modo, vedo lo sforzo / la comprensione extra richiesti per ottenere le prove di tipo III come mezzo per garantire che solo quelli che sanno davvero cosa stanno facendo seguono quella strada.

Ora, il richiedente più recente di tipo III ha sottolineato che l'argomento (2) è minato dalla considerazione delle circostanze in cui gli effetti esistenti ma "non significativi" di ordine superiore possono influenzare il calcolo delle somme di quadrati per gli effetti di ordine inferiore. In tali casi è immaginabile che un ricercatore guardi all'effetto di ordine superiore, e vedendo che è "non significativo", passa al tentativo di interpretare gli effetti di ordine inferiore che, all'insaputa del ricercatore, sono stati compromessi. La mia reazione iniziale è che questo non è un problema con somme di quadrati, ma con valori di p e la tradizione del test di ipotesi nulla. Sospetto che una misura più esplicita delle prove, come il rapporto di verosimiglianza, potrebbe avere maggiori probabilità di produrre un quadro meno ambiguo dei modelli supportati coerenti con i dati. Tuttavia, non ho


2
Tra poco - si. Semplicemente per consentire la coerenza con altri pacchetti (anche se il risultato è stato "sbagliato" in qualche modo - nel qual caso un massaggio di avvertimento andrebbe bene). E grazie per il tuo fantastico pacchetto!
Tal Galili,

Quando ho scritto "pacchetti" intendevo altri pacchetti statistici (come SPSS e SAS) - Sono contento che altri abbiano portato il punto più a casa poi l'ho fatto :)
Tal Galili

2
Come molti già sanno, l'attuale pacchetto ez (versione 3) ha aggiornato ezANOVA, che ha argomenti per SS Type e restituisce il modello aov.
jiggysoo,

Risposte:


9

Solo per amplificare: sono il richiedente più recente, credo.

Nel commento specifico sui punti di Mike:

  1. È chiaramente vero che la differenza I / II / III si applica solo ai predittori correlati (di cui i disegni squilibrati sono l'esempio più comune, certamente nell'ANOVA fattoriale) - ma questo mi sembra essere un argomento che respinge l'analisi della situazione sbilanciata (e quindi qualsiasi dibattito di tipo I / II / III). Può essere imperfetto, ma è così che accadono le cose (e in molti contesti i costi di un'ulteriore raccolta di dati superano il problema statistico, nonostante le avvertenze).

  2. Questo è completamente giusto e rappresenta la carne della maggior parte degli argomenti "II contro III, a favore di II" che ho incontrato. Il miglior riassunto che ho incontrato è Langsrud (2003) "ANOVA per i dati non bilanciati: usa il tipo II invece delle somme di quadrati di tipo III", Statistics and Computing 13: 163-167 (ho un PDF se l'originale è difficile da trovare ). Sostiene (prendendo il caso a due fattori come esempio di base) che se c'è un'interazione, c'è un'interazione, quindi la considerazione degli effetti principali di solito è insignificante (un punto ovviamente giusto) - e se non c'è interazione, l'analisi di Tipo II di gli effetti principali sono più potenti del Tipo III (senza dubbio), quindi dovresti sempre scegliere il Tipo II. Ho visto altri argomenti (ad esempio Venables,

  3. E sono d'accordo con questo: se hai un'interazione ma hai anche qualche domanda sull'effetto principale, allora probabilmente sei nel territorio fai-da-te.

Chiaramente ci sono quelli che vogliono solo il Tipo III perché lo fa SPSS, o qualche altro riferimento all'autorità superiore statistica. Non sono del tutto contrario a questo punto di vista, se si tratta di una scelta di molte persone che aderiscono a SPSS (che ho alcune cose contro, vale a dire tempo, denaro e condizioni di scadenza della licenza) e Tipo III SS, o un sacco di persone che si spostano su R e Tipo III SS. Tuttavia, questo argomento è chiaramente statisticamente poco chiaro.

Tuttavia, l'argomento che ho trovato piuttosto sostanziale a favore del Tipo III è quello sviluppato indipendentemente da Myers & Well (2003, "Design della ricerca e analisi statistica", pagg. 323, 626-629) e Maxwell & Delaney (2004, " Progettazione di esperimenti e analisi dei dati: una prospettiva di confronto tra modelli ", pagg. 324-328, 332-335). Questo è il seguente:

  • se c'è un'interazione, tutti i metodi danno lo stesso risultato per la somma delle interazioni dei quadrati
  • Il tipo II presuppone che non vi siano interazioni per il test degli effetti principali; il tipo III no
  • Alcuni (ad esempio Langsrud) sostengono che se l'interazione non è significativa, allora sei giustificato nel presupporre che non ce ne sia uno e guardando i (più potenti) effetti principali di Tipo II
  • Ma se il test dell'interazione è sottodimensionato, ma esiste un'interazione, l'interazione può risultare "non significativa" e tuttavia portare a una violazione dei presupposti del test sugli effetti principali di tipo II, tendendo questi test a essere troppo liberali .
  • Myers & Well citano Appelbaum / Cramer come i principali sostenitori dell'approccio di tipo II, e proseguono [p323]: "... Potrebbero essere usati criteri più conservativi per la non significatività dell'interazione, come richiedere che l'interazione non sia significativa a livello .25, ma la comprensione delle conseguenze di questo approccio è insufficiente. Come regola generale, le somme di quadrati di tipo II non dovrebbero essere calcolate a meno che non vi sia una forte ragione a priori per non assumere effetti di interazione e un'interazione chiaramente non significativa somma dei quadrati." Citano [p629] Nel complesso, Lee & Hornick 1981 come una dimostrazione che le interazioni che non si avvicinano alla significatività possono influenzare i test degli effetti principali. Maxwell & Delaney [p334] sostengono l'approccio di tipo II se l'interazione della popolazione è zero, per potere, e l'approccio di Tipo III se non lo è [per l'interpretazione dei mezzi derivati ​​da questo approccio]. Anche loro sostengono l'uso del Tipo III nella situazione della vita reale (quando si fanno deduzioni sulla presenza dell'interazione dai dati) a causa del problema di fare un errore di tipo 2 [sottodimensionato] nel test di interazione e quindi violare accidentalmente le ipotesi dell'approccio SS di tipo II; fanno quindi ulteriori punti simili a Myers & Well e prendono nota del lungo dibattito su questo tema! fare deduzioni sulla presenza dell'interazione dai dati) a causa del problema di commettere un errore di tipo 2 [sottodimensionato] nel test di interazione e violando così accidentalmente le ipotesi dell'approccio SS di tipo II; fanno quindi ulteriori punti simili a Myers & Well e prendono nota del lungo dibattito su questo tema! fare deduzioni sulla presenza dell'interazione dai dati) a causa del problema di commettere un errore di tipo 2 [sottodimensionato] nel test di interazione e violando così accidentalmente le ipotesi dell'approccio SS di tipo II; fanno quindi ulteriori punti simili a Myers & Well e prendono nota del lungo dibattito su questo tema!

Quindi la mia interpretazione (e non sono un esperto!) È che c'è molta Autorità statistica superiore su entrambi i lati dell'argomento; che i soliti argomenti avanzati non riguardano la solita situazione che potrebbe dare adito a problemi (tale situazione è quella comune di interpretare gli effetti principali con un'interazione non significativa); e che ci sono buone ragioni per essere preoccupati per l'approccio di tipo II in quella situazione (e si riduce a un potere contro una potenziale cosa di iper-liberalismo).

Per me, è abbastanza desiderare l'opzione di Tipo III in ezANOVA, così come il Tipo II, perché (per i miei soldi) è una superba interfaccia con i sistemi ANOVA di R. R è in qualche modo dall'essere facile da usare per i principianti, dal mio punto di vista, e il pacchetto "ez", con ezANOVA e le funzioni di creazione di effetti piuttosto adorabili, fa molto per rendere R accessibile a un pubblico di ricerca più generale. Alcuni dei miei pensieri in corso (e un brutto trucco per ezANOVA) sono su http://www.psychol.cam.ac.uk/statistics/R/anova.html .

Sarebbe interessato a sentire i pensieri di tutti!


Ah, non mi ero reso conto che la distinzione di tipo II / III emerge ogni volta che i predittori sono correlati, di cui un design sbilanciato è solo un esempio. Ciò certamente indebolisce ulteriormente il mio primo argomento "raccogli solo più dati".
Mike Lawrence,

2
Sono piuttosto convinto dal tuo argomento che R otterrà più convertiti SPSS se saranno dotati di mezzi semplici per ottenere analisi familiari, anche se queste analisi richiedono una considerazione più sfumata di quella che viene normalmente applicata. Quindi, una volta che li abbiamo agganciati a R, possiamo tentare di convincerli che l'approccio familiare non è necessariamente sempre l'approccio appropriato. Penso che inserirò ancora l'impostazione predefinita come type = 2 con un grande avvertimento nella documentazione che questa impostazione predefinita può produrre risultati che differiscono da SPSS e che i collegamenti fanno documentazione sulla distinzione di tipo II / III.
Mike Lawrence,

Altre variazioni su predittori correlati sono generalmente con predittori continui, ma sì, questo è il problema generale. // Mi sembra fantastico! A volte questi spostamenti sono lenti; l'uso delle correzioni della sfericità (piuttosto che ignorare il problema) è uno che penso siano stati fatti progressi nelle neuroscienze. Ci sono stati momenti in cui qualsiasi menzione di esso (in particolare se hai segnalato il df corretto, non intero) ha fatto pensare agli arbitri che stavi abbaiando.
Cardinale Rudolf,

Vorrei aggiungere che gli argomenti di Tipo III riguardano tutti i test di ipotesi conservativa o liberale, ma non il significato dei componenti. Un effetto principale nel Tipo III non è sensato perché include l'interazione con gli effetti principali mancanti. Indipendentemente dalle questioni conservative o liberali dei test, la coerenza del modello di base richiede il Tipo II perché un effetto principale di Tipo II ha senso. Detto questo, ezANOVA dovrebbe avere il Tipo III per altri motivi.
Giovanni,

7

Avvertenza: una risposta puramente non statistica. Preferisco lavorare con una funzione (o almeno un pacchetto) quando si esegue lo stesso tipo di analisi (ad es. ANOVA). Fino ad ora, uso costantemente Anova()poiché preferisco la sua sintassi per specificare i modelli con misure ripetute - rispetto a aov(), e perdere poco (SS tipo I) con misure non ripetute. ezANOVA()è utile per l'ulteriore vantaggio delle dimensioni dell'effetto. Ma ciò che non mi piace particolarmente è dover affrontare 3 diverse funzioni per fare essenzialmente lo stesso tipo di analisi, solo perché una di esse implementa la funzione X (ma non Y) e l'altra Y (ma non X).

Per ANOVA, posso scegliere tra oneway(), lm(), aov(), Anova(),ezANOVA() , e probabilmente altri. Quando insegni R, è già una seccatura spiegare le diverse opzioni, come si relazionano tra loro ( aov()è un involucro per lm()) e quale funzione fa cosa:

  • oneway()solo per progetti a fattore singolo ma con opzione var.equal=FALSE. Nessuna tale opzione in aov()e altri, ma quelle funzioni anche per i progetti multifattoriali.
  • sintassi per misure ripetute un po 'complicate in aov() , meglio dentroAnova()
  • conveniente SS tipo I solo in aov() , non inAnova()
  • conveniente SS tipo II e III solo in Anova() , non inaov()
  • dimensioni dell'effetto conveniente misurano in ezANOVA() , non in altri

Sarebbe bello dover solo insegnare una funzione con una sintassi coerente che fa tutto. Senza un comodo SS di tipo III, ezANOVA()non può essere quella funzione per me perché so che gli studenti saranno invitati a usarli ad un certo punto ("basta controllare incrociato questi risultati che John Doe ha ottenuto con SPSS"). Sento che è meglio avere la possibilità di fare la scelta da soli senza dover imparare ancora un'altra sintassi per specificare i modelli. L'atteggiamento "So cosa è meglio per te" può avere i suoi meriti, ma può essere iperprotettivo.


1
Per aggiungere un ulteriore requisito: sarebbe assolutamente fantastico se la funzione fosse anche in grado di eseguire tutti i tipi di contrasti da questo ANOVA, ad esempio, usando il multcomppacchetto (che, per quanto mi ricordo, richiede aovoggetti). Altrimenti, sono totalmente e normalmente d'accordo ezper il mio dovere quotidiano, perché è così facile ...
Henrik

1
l'aggiunta di un argomento "method" (con valori possibili come "oneway", "aov" e "Anova" e con un argomento "..." per passare var.eq = FALSE a oneway e type = 2 a Anova) è un'idea intrigante, e sembra certamente che sarebbe abbastanza facile da incorporare. Grazie per il suggerimento
Mike Lawrence,

@Henrik: devo essere sincero che la mia comprensione dei contrasti è molto limitata e non li uso mai nelle mie ricerche, quindi non ho dato la priorità all'incorporazione dei contrasti in ez.
Mike Lawrence,

@Mike Se puoi aggiungere l'argomento del metodo e quindi la tua funzione sarebbe in grado di restituire un aovelemento che sarebbe fantastico. Finora di solito sono troppo pigro per creare il mio aovelemento e ezANOVAusarti invece con t.tests ...
Henrik

@Mike Non avevo osato suggerire una cosa del genere dato che è il tuo lavoro che stai inserendo. Grazie per quello! Il ezpacchetto ha un grande potenziale: in psicologia, è già raccomandato abbastanza spesso (vedi il libro tedesco "R für Einsteiger" di Luhmann). Renderlo ancora più flessibile sarebbe sicuramente apprezzato.
Caracal,

2

Al mondo R non piace molto il tipo 3 SS.

Uno dei riferimenti solitamente citati è "Exegeses on Linear Models" di Bill Venables (2000) .

Spero di non sbagliarlo, ma penso che il suo argomento principale sia che le SS di tipo 3 violano il principio di marginalità dei modelli lineari e quindi non sono ragionevoli.


0

Questo è stato un dibattito che mi ha aperto gli occhi sulla questione di tipo II / III per me. Grazie per lo sforzo di tutti nel fornire la discussione. Mi verrebbe in mente di promuovere il tipo II in modo coerente rispetto al tipo III, ma avevo una debole comprensione dell'argomento - mi basavo solo sui consigli del libro di regressione di John Fox (macchina) secondo cui i test di tipo III erano raramente interpretabile (beh, penso che l'abbia detto ...).

Comunque, ezANOVA è davvero utile per consentire l'accesso alla funzionalità R che sarebbe altrimenti impossibile per gli studenti universitari che insegno in psicologia. Fornisco moduli R online, uno con ezANOVA per dimostrare progetti ANOVA misti (anche se sembra che la versione 3 precedente potrebbe essere stata buggy per questo ... doh!)

Provalo qui:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

dopo il caricamento del modulo (~ 10s) trova il pulsante di calcolo (a metà pagina) e eseguirà ezANOVA e le tabelle e i grafici associati.

Ian


Quando dici che ez era difettoso per progetti ANOVA misti, lo stai basando sul mio recente annuncio della versione 3.0 in cui noto che c'era un bug nel codice ezMixed ()? Se è così, penso che tu abbia frainteso quella nota. ezMixed () non è correlato a ezANOVA (). ezMixed () serve per aiutare a valutare l'influenza degli effetti fissi in un contesto di modellazione di effetti misti.
Mike Lawrence,

Ciao Mike - hai perfettamente ragione - era la tua nota su ezMixed () Ho letto e interpretato male questo per ezANOVA ().
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.