Quali sono i diversi tipi di codifiche disponibili per le variabili categoriali (in R) e quando le useresti?


14

Se si adatta un modello lineare o un modello misto, sono disponibili diversi tipi di codifica per trasformare una varibale categorica o nominale in un numero di variabili per le quali vengono stimati i parametri, come il conding fittizio (impostazione predefinita R) e la codifica degli effetti.

Ho sentito che la codifica degli effetti (a volte chiamata deviazione o codifica del contrasto) è preferita quando si hanno interazioni, ma quali sono i possibili contrasti e quando useresti quale tipo di contrasto?

Il contesto è la modellazione mista nell'uso di R lme4, ma penso che risposte più ampie vadano bene. Scusa, se ho perso una domanda simile.

EDIT: due link utili sono: spiegazione degli effetti e codifica fittizia .


se hai Modern Applied Statistics con S-Plus, ha una grande sezione nel Capitolo Sei proprio su questa domanda
richiemorrisroe,

4
Non credo che troverete una risposta completa alla tua domanda, ma ci sono un sacco di buone informazioni sui diversi tipi di codifiche qui .
gung - Ripristina Monica

@gung Il sito sembra davvero interessante. Tuttavia non sembra coprire la codifica del contrasto (o esiste un altro nome).
Henrik,

Non ne sono sicuro; Mi chiedo se ci sia un errore di comunicazione. Il titolo di quella pagina è "codifica del contrasto".
gung - Ripristina Monica

1
Non capisco bene quale domanda rimanga. Se volevi un elenco di diversi tipi di codifica, ce l'hai. Qual è la spinta principale della tua domanda ora?
gung - Ripristina Monica

Risposte:


4

Altri possono illuminarmi se sbaglio, ma qui va ...

Qual è l'effetto per il livello rispetto alla media dei livelli precedenti? vale a dire che sei interessato a individuare la soglia dell'effetto

  • Usa i contrasti di Helmert. Penso a questo come confronti cumulativi. L'ho usato quando ero interessato a determinare un limite dose-risposta all'esposizione dei farmaci. Il confronto con più livelli alla volta significa che vengono eliminate meno informazioni. Penso a questo come confronti cumulativi.

Qual è l'effetto del livello rispetto a un livello di base? cioè sei interessato a un gruppo di confronto di base.

  • Utilizzare la codifica variabile fittizia (contrasti del trattamento). Penso a questo come confronti di base. L'ho usato quando in genere esiste un gruppo / livello stabilito come importante da altri studi e il mio studio sta dimostrando che esistono associazioni anche quando viene superata questa soglia.

Qual è l'effetto di due livelli adiacenti di una variabile?

  • Usa la differenza avanti / indietro. Penso a questo come confronti successivi a breve intervallo. L'ho usato quando ho confrontato gli effetti per diversi livelli di posizione socioeconomica, quando ogni gruppo è compositivamente diverso a sé stante e non più interessante di nessun altro.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.