Variabile dell'indicatore per i dati binari: {-1,1} vs {0,1}


10

Sono interessato a interazioni trattamento-covariate nel contesto di esperimenti / studi clinici controllati randomizzati, con un binario trattamento assegnato indicatore .T

A seconda del metodo / fonte specifici, ho visto sia che per i soggetti trattati e non trattati.T = { 1 , - 1 }T={1,0}T={1,1}

C'è qualche regola empirica quando usare o ?{ 1 , - 1 }{1,0}{1,1}

In che modo l'interpretazione differisce?


FWIW ... Questo primo link fornisce una panoramica abbastanza completa dei diversi schemi di codifica ... ats.ucla.edu/stat/r/library/contrast_coding.htm Questo secondo indicatore di collegamento discute (fittizio), effetto e ortogonali (contrasto) di codifica ... faculty.cas.usf.edu/mbrannick/regression/anova1.html
Mike Hunter

Risposte:


10

L'interpretazione sia dello stimatore della variabile indicatore sia dell'intercettazione differisce. Cominciamo con :{1,0}

Supponi di avere il seguente modello

yi=β0+treatmentβ1

dove

treatment={0if placebo1if drug

In tal caso si finisce con le seguenti formule per :yi

yi={β0+0β1=β0if placeboβ0+1β1=β0+β1if drug

Quindi l'interpretazione di è l'effetto del placebo e l'interpretazione di è la differenza tra l'effetto del placebo e l'effetto del farmaco. In effetti, puoi interpretare come il miglioramento dal farmaco.β 1 β 1β0β1β1


Ora diamo un'occhiata a :{1,1}

Quindi hai il seguente modello (di nuovo):

yi=β0+treatmentβ1

ma dove

treatment={1if placebo1if drug

In tal caso si finisce con le seguenti formule per :yi

yi={β0+1β1=β0β1if placeboβ0+1β1=β0+β1if drug

L'interpretazione qui è che è la media dell'effetto del placebo e dell'effetto del farmaco, e è la differenza dei due trattamenti con quella media.β 1β0β1


Quindi quale usi?

L'interpretazione di in è sostanzialmente una base. Hai impostato un trattamento standard e tutti gli altri trattamenti (possono essercene più) vengono confrontati con quello standard / basale. Soprattutto quando inizi ad aggiungere altre covariate, questo rimane facile da interpretare rispetto alla domanda medica standard: come si confrontano questi farmaci con un placebo o con il farmaco stabilito? { 0 , 1 }β0{0,1}

Ma alla fine è tutta una questione di interpretazione, che ho spiegato sopra. Quindi dovresti valutare le tue ipotesi e verificare quale interpretazione rende il disegno delle conclusioni il più semplice.


6
La costante quando si utilizza la codifica -1, 1 è la media se il numero di intervistati nel gruppo trattato è uguale al numero di intervistati nel gruppo di controllo.
Maarten Buis,

@MaartenBuis È la media della se e solo se il disegno è bilanciato, ma per il resto è ancora la media dei due mezzi di gruppo, che è ciò che intendo. Ho modificato il testo per riflettere questo. y
JAD

9
Utile. Cerco sempre di incoraggiare l'uso della parola 'indicatore piuttosto che fittizio (come nella domanda originale!) Per almeno due ragioni. Innanzitutto, ho ascoltato troppe storie in cui le presentazioni sono andate molto male perché termini come "manichino di genere" sono stati erroneamente interpretati come denigratori o offensivi da persone meno tecniche. In secondo luogo, il termine fittizio fa sembrare l'intero dispositivo un po 'come un fondente o una schivata, mentre è un metodo perfettamente pulito ed elegante. Non ho molte possibilità di cambiare le pratiche radicate in alcuni campi, ma qui ci sto provando.
Nick Cox,

D'accordo, sembra anche più professionale. Inoltre è una descrizione migliore di ciò che sta effettivamente facendo.
JAD

2
Sono contento che tu sia d'accordo. Ecco un modo semplice per spiegare: si chiama indicatore perché indica!
Nick Cox,

6

Nel contesto della regressione lineare, è il metodo più naturale (e standard) per codificare le variabili binarie (sia posizionandole sul lato sinistro del lato destro della regressione). Come spiega @Jarko Dubbeldam, puoi ovviamente usare l'altra interpretazione e il significato dei coefficienti sarà diverso.xi{0,1}

Per fare un esempio in altro modo, la codifica delle variabili di output è standard quando si programma o si ricavano le macchine vettoriali di supporto sottostanti alla matematica . (Quando si chiamano le librerie, si desidera passare i dati nel formato previsto dalla libreria, che è probabilmente la formulazione 0, 1).yi{1,1}

Prova a usare la notazione standard per qualunque cosa tu stia facendo / usando.


Per qualsiasi tipo di modello lineare con un termine di intercettazione, i due metodi saranno equivalenti nel senso che sono collegati da una semplice trasformazione lineare. Matematicamente, non importa se usi la matrice di dati o la matrice di dati dove è al livello massimo. Nei modelli lineari generalizzati, i coefficienti stimati in entrambi i modi saranno correlati dalla trasformazione lineare e i valori adattati saranno gli stessi.~ X = X A A A yXX~=XAAAy^


+1, non riuscivo a pensare a un'impostazione in cui veniva utilizzato . {1,1}
JAD

AdaBoost è un altro esempio che utilizzayi{1,1}
Francis,

5
In generale, si potrebbe dire che è usato principalmente nella classificazione, perché rende l'applicazione della funzione segno un modo fattibile per classificare. {1,1}
JAD

@matthewgunn L'autore sta parlando delle covariate, cioè degli input, non degli output. {-1, 1} ha senso per i vettori di supporto per l'output ma non ha importanza per l'input. Vedi qui: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM
Francisco Arceo

@FranciscoArceo Punto preso; Ho modificato per essere più preciso.
Matthew Gunn,

2

Questo è più astratto (e forse inutile), ma noterò che queste due rappresentazioni sono, in senso matematico, in realtà rappresentazioni di gruppo, e c'è un isomorfismo tra di loro.

Il significato della variabile indicatore , nel cuore un valore booleano, è "fattore è vero" o "fattore è falso". Dati due eventi e , potresti chiedere "i fattori di questi due eventi sono equivalenti, ad esempio sono entrambi veri o entrambi falsi?" Nella logica booleana si tratta di . Questo definisce una struttura di gruppo . Ora, e formano entrambe le rappresentazioni di questo gruppo, con le operazioni di gruppo e , rispettivamente. L'isomorfismo dalla prima rappresentazione alla seconda è dato daTT1T2T1T2Z21,01,1ab=1(a+b)ab=abϕ(a)=2a1.

Questa rappresentazione si estende anche alle variabili continue dell'indicatore, cioè le probabilità. Se è la probabilità che sia vera, allora la probabilità che sia vera è . Sotto l'isomorfismo , questo è . La quantità è un indicatore con segno compreso tra -1 e 1. Quindi, i calcoli sulle probabilità delle operazioni booleane sono spesso molto più semplici su questa base.T T T p p = p p + ( 1 - p ) ( 1 - p ) t ( p ) = 2 p - 1 t t = t t tpTTTpp=pp+(1p)(1p)t(p)=2p1tt=ttt


Questo è impressionante, ma trovo sufficiente osservare che qualsiasi corrispondenza valida tra {-1, 1} e {0, 1} deve essere una a una: non è necessario invocare nulla oltre la matematica delle superiori. Stiamo necessariamente parlando delle stesse informazioni, codificate in modo diverso.
Nick Cox,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.