Regressione logistica e variabili ordinali indipendenti


10

Ho trovato questo post:

Sì. Il coefficiente riflette la variazione delle probabilità del registro per ogni incremento della variazione nel predittore ordinale. Questa specifica del modello (molto comune) presuppone che il predittore abbia un impatto lineare sui suoi incrementi. Per testare l'assunto, è possibile confrontare un modello in cui si utilizza la variabile ordinale come un singolo predittore con uno in cui si discretizzano le risposte e le trattano come predittori multipli (come si farebbe se la variabile fosse nominale); se quest'ultimo modello non risulta in una misura significativamente migliore, allora è ragionevole considerare ogni incremento come avere un effetto lineare.

- @ dmk38, 12 dicembre 10 alle 5:21

Potresti dirmi dove posso trovare qualcosa pubblicato che supporta questa affermazione? Sto lavorando con i dati e vorrei utilizzare variabili ordinali indipendenti nella regressione logistica.


Visualizza una domanda simile stats.stackexchange.com/q/195246/3277
ttnphns

Risposte:


2

Come osserva @Scortchi , puoi anche usare polinomi ortogonali. Ecco una breve dimostrazione in R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...

8

Qualsiasi buon libro sulla regressione logistica avrà questo, anche se forse non esattamente in quelle parole. Prova l'Analisi dei dati categorici di Agresti per una fonte molto autorevole.

Segue anche dalla definizione di regressione logistica (o altre regressioni). Esistono pochi metodi espliciti per variabili ordinali indipendenti. Le solite opzioni lo trattano come categorico (che perde l'ordine) o come continuo (che rende l'assunto dichiarato in quello che hai citato). Se lo consideri continuo, il programma che esegue l'analisi non sa che è ordinale. Ad esempio, supponiamo che il tuo IV sia "Quanto ti piace il presidente Obama?" e le tue scelte di risposta sono una scala Likert da 1. "Molto" a 5. "Niente affatto". Se lo consideri continuo allora (dal punto di vista del programma) una risposta "5" è 5 volte una risposta "1". Questo può o meno essere irragionevole.


3
Sezione 5.4.6. E puoi estendere l'idea usando i polinomi ortogonali per codificare il predittore ordinale.
Scortchi - Ripristina Monica

Grazie per i tuoi commenti, aiuteranno molto nella mia analisi.
Frederico,

2
@Frederico, se la risposta di Peter ha risolto la tua domanda, dovresti accettarla facendo clic sul segno di spunta sotto il totale dei voti a sinistra.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.