Sei sulla strada giusta, ma dai sempre un'occhiata alla documentazione del software che stai utilizzando per vedere quale modello è effettivamente adatto. Supponi una situazione con una variabile dipendente categoriale Y con le categorie ordinate 1,…,g,…,k e i predittori X1,…,Xj,…,Xp .
"In the wild", puoi trovare tre opzioni equivalenti per scrivere il modello teorico di probabilità proporzionale con diversi significati di parametri impliciti:
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g+β1X1+⋯+βpXp(g=1,…,k−1)
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g−(β1X1+⋯+βpXp)(g=1,…,k−1)
- logit(p(Y⩾g))=lnp(Y⩾g)p(Y<g)=β0g+β1X1+⋯+βpXp(g=2,…,k)
(I modelli 1 e 2 hanno la limitazione che nelle regressioni logistiche binarie separate , il non varia con , e , il modello 3 ha la stessa restrizione su e richiede che )k−1βjgβ01<…<β0g<…<β0k−1βjβ02>…>β0g>…>β0k
- Nel modello 1, un positivo significa che un aumento predittore è associata ad un aumento probabilità per una bassa categoria in .βjXjY
- Il modello 1 è in qualche modo controintuitivo, quindi il modello 2 o 3 sembra essere il preferito nel software. Qui, una positiva significa che un aumento del predittore è associata ad un aumento probabilità per una più alta categoria in .βjXjY
- I modelli 1 e 2 portano alle stesse stime per , ma le loro stime per hanno segni opposti.β0gβj
- I modelli 2 e 3 portano alle stesse stime per , ma le loro stime per hanno segni opposti.βjβ0g
Supponendo che il tuo software utilizzi il modello 2 o 3, puoi dire "con un aumento di 1 unità in , ceteris paribus, le probabilità previste di osservare ' ' rispetto all'osservazione ' "cambia di un fattore di .", e similmente "con un aumento di 1 unità in , ceteris paribus, le probabilità previste di osservare" 'rispetto all'osservazione' 'cambia di un fattore di . " Si noti che nel caso empirico, abbiamo solo le probabilità previste, non quelle effettive.X1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Badeβ^1=0.607
Ecco alcune illustrazioni aggiuntive per il modello 1 con categorie. Innanzitutto, l'assunzione di un modello lineare per i logit cumulativi con probabilità proporzionali. In secondo luogo, le probabilità implicite di osservare al massimo la categoria . Le probabilità seguono funzioni logistiche con la stessa forma.
k=4g
Per le stesse probabilità di categoria, il modello rappresentato implica le seguenti funzioni ordinate:
PS Per quanto ne so, il modello 2 viene utilizzato in SPSS, nonché nelle funzioni R MASS::polr()
e ordinal::clm()
. Il modello 3 è utilizzato nelle funzioni R rms::lrm()
e VGAM::vglm()
. Sfortunatamente, non conosco SAS e Stata.