Regressione logistica con variabili binarie dipendenti e indipendenti


14

È appropriato eseguire una regressione logistica in cui le variabili dipendenti e indipendenti sono binarie? ad esempio la variabile dipendente è 0 e 1 e i predittori sono variabili codificate in contrasto -1 e 1?

Risposte:


6

Non c'è motivo per non farlo, ma due pensieri cautelativi:

  1. Tieni traccia attenta durante l'analisi di quale sia. In progetti di grandi dimensioni, può essere facile perdersi e produrre risultati errati.

  2. Se si sceglie di riportare stime di regressione, piuttosto che rapporti di probabilità, chiarire il proprio schema di codifica nel proprio report , in modo che i lettori non producano OR imprecisi da soli supponendo che fossero entrambi codificati 0,1.

Può sembrare basilare, ma ho visto entrambi i problemi trasformarsi in articoli pubblicati.


Quindi sarebbe anche appropriato separare un file di dati in 6 casi separati ed eseguire confronti individuali all'interno di ciascun set di dati con predittori con codice constrast?
fino al

Onestamente non sono sicuro di cosa stai chiedendo per questo secondo bit. Puoi chiarire ciò che speri di realizzare?
Fomite,

Ho un set di dati con 3 tra e 4 in base alle condizioni. Vorrei testare ogni singolo effetto, ma una singola regressione con tutte le interazioni manca a molte informazioni che mi interessano. Invece dividerei i dati per condizione in set di dati separati ed eseguirei regressioni logistiche focalizzate su ogni set di dati con contrasto codici che codificano per le differenze che mi interessano.
sopra il

per ulteriori informazioni su come codifico i
upabove il

11

Per chiarezza: il termine "binario" è di solito riservato solo alla codifica 1 vs 0. La parola più generica adatta per qualsiasi codice a 2 valori è "dicotomica". I predittori dicotomici sono ovviamente benvenuti alla regressione logistica, come alla regressione lineare e, poiché hanno solo 2 valori, non fa alcuna differenza se inserirli come fattori o come covariate.


5

In genere aiuta l'interpretazione se si codificano i predittori 0-1, ma a parte questo (e notando che non è necessario), non c'è nulla di sbagliato in questo. Esistono altri approcci (basati sulla tabella di contingenza), ma se ricordo bene, questi risultano essere equivalenti a (qualche forma di) regressione logistica.

Quindi in breve: non vedo alcun motivo per non farlo.


Grazie! E se ho 3 predittori con codice di contrasto e li codifico tutti per 0-1, non saranno ortogonali. Ad esempio ho 4 categorie e i miei tre codici sono L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. è un problema?
sopra

La tua matrice L di esempio (L1, L2, L3) sono i contrasti ripetuti con cui ogni categoria viene confrontata con la seguente categoria. Né questi predittori di contrasto sono ortogonali né binari (codificati come 0-1). In effetti, i loro valori sono .75 vs -.25 (prima variabile), .5 vs -.5 (seconda variabile), .25 vs -.75 (terza variabile)
ttnphns

3

Inoltre, se hai più di due predittori, è più probabile che ci sia un problema di multi-collinearità anche per la regressione logistica o multipla. Tuttavia, non vi è alcun danno nell'utilizzare la regressione logistica con tutte le variabili binarie (cioè codificate (0,1)).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.