Cosa fare quando alcuni punti temporali hanno risposte fortemente distorte e altri no in uno studio di misure ripetute?


12

Tipicamente, quando si incontrano misure di risultato continue ma distorte in un disegno longitudinale (diciamo, con un effetto tra soggetti) l'approccio comune è quello di trasformare il risultato in normalità. Se la situazione è estrema, come nel caso delle osservazioni troncate, si potrebbe essere fantasiosi e utilizzare un modello di curva di crescita di Tobit, o qualcosa del genere.

Ma sono in perdita quando vedo risultati normalmente distribuiti in determinati momenti e poi fortemente distorti in altri; la trasformazione può tappare una perdita ma innescarne un'altra. Cosa potresti suggerire in questo caso? Esistono versioni "non parametriche" di modelli di effetti misti di cui non sono a conoscenza?

Nota: un esempio applicato sarebbero i punteggi dei test di conoscenza pre / post una serie di interventi educativi. I punteggi iniziano normalmente ma poi si raggruppano nella parte alta della scala in seguito.


6
L'esempio è interessante perché si verifica sempre. Ci sono trasformazioni ben note per affrontarlo, come le trasformazioni di potere "piegate" di Tukey. Questi apportano pochi cambiamenti nel mezzo della scala ma curano l'asimmetria ad entrambe le estremità. Ho scoperto che le radici e i registri piegati funzionano molto bene per confronti standard pre / post test.
whuber

Grazie Whuber . Esaminerò l'approccio di trasformazione piegato.
Brenden Dufault,

1
Per una definizione ed esempi, Brenden, consultare stats.stackexchange.com/a/10979 . Per istruzioni sul loro uso, vedere gli ultimi capitoli nel libro EDA di Tukey .
whuber

2
Nota aggiuntiva: ricordare che vengono fatte ipotesi sui residui del modello, non sulle variabili effettive coinvolte.
Peter Flom - Ripristina Monica

Risposte:


1

Supponendo che il problema si verifichi nei tuoi residui (poiché la distribuzione della variabile di risultato in sé non è di solito un problema), cercherei di indagare sulla causa del problema piuttosto che cercare di "risolverlo" tramite una trasformazione o l'applicazione di un modello non parametrico.

Se sembra che ci sia una tendenza (ad esempio, progressivamente diventando più o meno normale) o una chiara interruzione tra quando passa da normale a non normale, allora suggerisce un "cambio di regime" di qualche tipo in i tuoi dati (ovvero, il meccanismo di generazione dei dati sta cambiando nel tempo) o qualche tipo di problema di variabile mancante.

Se non ci fosse un modello ovvio (ad esempio, i periodi di tempo 1 e 3 sembrano normali e i periodi di tempo 2 e 4 non lo fanno), cercherei molto attentamente un problema di integrità dei dati.

Un modo semplice per verificare se si verifica un cambio di regime consiste nel stimare il modello utilizzando solo i periodi di tempo "normali" e quindi riesaminare utilizzando gli altri periodi di tempo e vedere quale differenza si verifica. Un approccio più complicato consiste nell'utilizzare un modello di classe latente, forse con il tempo come variabile concomitante.

Per quanto riguarda la tua domanda sui modelli di effetti misti non parametrici, dipende in qualche modo da cosa intendi per non parametrico. Se intendi modelli che non assumono una variabile numerica dipendente, allora ci sono molti di questi modelli (ad esempio, LIMDEP ne ha parecchi). Inoltre, tieni presente che la violazione del presupposto della normalità sarà probabilmente problematica dal punto di vista dell'inferenza se la dimensione del campione è piccola. Un modo per indagare su questo sarebbe provare le varie trasformazioni discusse in altri commenti e risposte e vedere se ha un grande impatto sulle tue conclusioni.


+1 Grazie, Tim. Apprezzo i tuoi suggerimenti riguardo ai modelli di classe latente e LIMDEP. Questi approcci stanno diventando sempre più attraenti per me quando inizio a saperne di più su di loro.
Brenden Dufault,

0

Esistono trasformazioni Box-Cox che elevano la variabile a una potenza lambda in cui lambda è inclusa nella stima dei parametri del modello. Non ho familiarità con la trasformazione del potere piegato di Tukey, quindi non so se stiamo parlando della stessa cosa. In orde per stimare lambda hai bisogno di più punti nell'adattamento. Vuoi adattare una diversa distribuzione in ogni momento in cui la distribuzione è definita su un insieme di soggetti che effettuano il test in ogni momento? Anche se questo è il caso se sai che alcuni punti temporali dovrebbero avere la stessa distribuzione, potresti volerli combinare in un unico adattamento.

Un altro approccio che non è parametrico e non comporta trasformazioni alla normalità sarebbe quello di applicare il bootstrap in ogni momento o in ogni insieme combinato di punti temporali.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.