Ho una variabile dipendente ordinale, facilità, che varia da 1 (non facile) a 5 (molto facile). L'aumento dei valori dei fattori indipendenti è associato ad un aumento del grado di facilità.
Due delle mie variabili indipendenti ( condA
e condB
) sono categoriche, ognuna con 2 livelli e 2 ( abilityA
, abilityB
) sono continue.
Sto usando il pacchetto ordinale in R, dove utilizza ciò che credo sia
(dalla risposta di @ caracal qui )
Ho imparato questo in modo indipendente e gradirei qualsiasi aiuto possibile poiché sto ancora lottando con esso. Oltre ai tutorial che accompagnano il pacchetto ordinale, ho trovato utili anche i seguenti:
- Interpretazione della regressione logistica ordinale
- Coefficiente negativo nella regressione logistica ordinata
Ma sto cercando di interpretare i risultati, mettere insieme le diverse risorse e mi sto bloccando.
Ho letto molte spiegazioni diverse, sia astratte che applicate, ma faccio ancora fatica a pensare a cosa significhi dire:
Con un aumento di 1 unità di condB (ovvero, passando da un livello a quello successivo del predittore categorico), le probabilità previste di osservare Y = 5 rispetto a Y = 1 a 4 (nonché le probabilità previste di Y osservato = 4 rispetto a Y = da 1 a 3) cambia di un fattore di exp (beta) che, per il diagramma, è exp (0.457) = 1.58.
un. È diverso per le variabili indipendenti categoriali e continue?
b. Parte della mia difficoltà potrebbe essere con l'idea delle probabilità cumulative e quei confronti. ... È corretto affermare che passare da condA = assente (livello di riferimento) a condA = presente ha una probabilità 1,58 volte maggiore di essere valutato a un livello di facilità superiore? Sono abbastanza sicuro che NON sia corretto, ma non sono sicuro di come affermarlo correttamente.
Graficamente,
1. Implementando il codice in questo post , sono confuso sul perché i valori di "probabilità" risultanti siano così grandi.
2. Il grafico di p (Y = g) in questo post ha più senso per me ... con un'interpretazione della probabilità di osservare una particolare categoria di Y ad un particolare valore di X. Il motivo che sto cercando di ottenere il grafico in primo luogo è quello di comprendere meglio i risultati in generale.
Ecco l'output dal mio modello:
m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID),
data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation
formula:
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) + (1 | ID)
data: d
link threshold nobs logLik AIC niter max.grad
logit flexible 366 -468.44 956.88 729(3615) 4.36e-04
cond.H
4.5e+01
Random effects:
Groups Name Variance Std.Dev.
ID (Intercept) 2.90 1.70
content (Intercept) 0.24 0.49
Number of groups: ID 92, content 4
Coefficients:
Estimate Std. Error z value Pr(>|z|)
condA 0.681 0.213 3.20 0.0014 **
condB 0.457 0.211 2.17 0.0303 *
abilityA 1.148 0.255 4.51 6.5e-06 ***
abilityB 0.577 0.247 2.34 0.0195 *
Threshold coefficients:
Estimate Std. Error z value
1|2 -3.500 0.438 -7.99
2|3 -1.545 0.378 -4.08
3|4 0.193 0.366 0.53
4|5 2.121 0.385 5.50