ANOVA con osservazioni non indipendenti


11

Ci scusiamo per lo sfondo dettagliato di questa domanda:

Occasionalmente nelle indagini sul comportamento animale, uno sperimentatore è interessato alla quantità di tempo che un soggetto trascorre in diverse zone predefinite in un apparato di prova. Ho visto spesso questo tipo di dati analizzati usando ANOVA; tuttavia, non sono mai stato del tutto convinto della validità di tali analisi, dato che ANOVA presume che le osservazioni siano indipendenti e che in realtà non siano mai indipendenti in queste analisi (poiché più tempo trascorso in una zona significa che meno viene speso in altre zone! ).

Per esempio,

DR Smith, CD Striplin, AM Geller, RB Mailman, J. Drago, CP Lawler, M. Gallagher, Valutazione comportamentale di topi privi di recettori della dopamina D1A , Neuroscienze, Volume 86, Numero 1, 21 maggio 1998, Pagine 135-146

Nell'articolo precedente, riducono di 1 il grado di libertà per compensare la non indipendenza. Tuttavia, non sono sicuro di come una simile manipolazione possa effettivamente migliorare questa violazione delle ipotesi ANOVA.

Forse una procedura chi-quadrata potrebbe essere più appropriata? Cosa faresti per analizzare dati come questo (preferenza per le zone, in base al tempo trascorso nelle zone)?

Grazie!

Risposte:


3

(Caveat Emptor: non sono un esperto in questo settore)

Se vuoi solo parlare delle differenze nel tempo trascorso per posizione, quindi inviare i dati "tempo per posizione" come conteggi in un modello misto multinomiale (vedi il pacchetto MCMCglmm per R), usando l'oggetto come effetto casuale, dovrebbe fare il trucco.

Se vuoi parlare delle differenze nella preferenza di posizione nel tempo, quindi magari trascinare il tempo a intervalli ragionevoli (forse alla risoluzione del tuo dispositivo di temporizzazione?), Classifica ogni intervallo in base alla posizione del mouse in quel momento (ad es. Se 3 posizioni, ogni intervallo viene etichettato 1, 2 o 3) e usa nuovamente un modello multinomiale di effetti misti con soggetto come effetto casuale, ma questa volta aggiungi l'intervallo come effetto fisso (anche se probabilmente solo dopo l'intervallo di fattorizzazione, che diminuisce la potenza ma dovrebbe aiutare catturare non linearità nel tempo).


5

Mike,

Sono d'accordo che un ANOVA basato sul tempo totale probabilmente non è l'approccio corretto qui. Inoltre, non sono convinto che Chi Sqaure risolva il tuo problema. Chi square rispetterà l'idea che non puoi essere in due posizioni contemporaneamente, ma non risolve il problema che ci sono probabilmente dipendenze tra il tempo N e il tempo N + 1. Per quanto riguarda questo secondo numero, vedo alcune analogie tra la tua situazione e ciò che le persone incontrano con i dati di tracciamento dell'occhio e del mouse. Un modello multinomiale di qualche tipo può servire bene ai tuoi scopi. Sfortunatamente, i dettagli di quel tipo di modello vanno oltre la mia competenza. Sono sicuro che un libro di statistiche da qualche parte abbia un piccolo e semplice primer su questo argomento, ma dalla parte superiore della mia testa ti indirizzerei verso:

  • Barr DJ (2008) Analizzando i dati di tracciamento del "mondo visivo" usando la regressione logistica multilivello. Journal of Memory and Language, Special Issue: Emerging Data Analysis (59) pp 457-474
  • https://r-forge.r-project.org/projects/gmpm/ è un approccio non parametrico allo stesso problema sviluppato dal Dr. Barr

Semmai, entrambe queste fonti dovrebbero essere più che complete perché entrano nel modo di analizzare l'andamento temporale della posizione.


4

Esamina i modelli con errori spazialmente correlati (e covariate spazialmente correlate). Una breve introduzione, con riferimenti a GeoDa , è disponibile qui . Ci sono molti testi; quelli buoni sono di Noel Cressie , Robert Haining e Fotheringham et al (l'ultimo link va a un sommario, non a un sito di libri). Recentemente sta emergendo del codice R, ma non ho familiarità con esso.


3

Sto per suggerire una risposta che è molto diversa da quella di un ANOVA tradizionale. Sia T il tempo totale disponibile per un animale da trascorrere in tutte le zone. È possibile definire T come la quantità totale di tempo di veglia o alcuni di questi. Supponiamo di avere J zone. Quindi per definizione hai:

Somma T_j = T

Potresti normalizzare quanto sopra dividendo lhs e rhs per T e otterrai

Somma P_j = 1

dove P_j è la percentuale di tempo che un animale trascorre nella zona j.

Ora la domanda che hai è se P_j è significativamente diverso da 1 / J per tutti j.

Si potrebbe supporre che P_j segua una distribuzione dirichlet e stimare due modelli.

Modello nullo

Impostare i parametri della distribuzione in modo tale che P_j = 1 / J. (L'impostazione dei parametri della distribuzione su 1 farà.)

Modello alternativo

Impostare i parametri della distribuzione in modo che siano una funzione delle covariate specifiche della zona. È quindi possibile stimare i parametri del modello.

Sceglieresti il ​​modello alternativo se supera il modello null su alcuni criteri (ad es. Rapporto di verosimiglianza).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.