Devo fare la regressione logistica binaria con molte variabili indipendenti. La maggior parte di essi è binaria, ma alcune delle variabili categoriali hanno più di due livelli.
Qual è il modo migliore per gestire tali variabili?
Ad esempio, per una variabile con tre possibili valori, suppongo che debbano essere create due variabili fittizie. Quindi, in una procedura di regressione graduale, è meglio testare entrambe le variabili fittizie contemporaneamente o testarle separatamente?
Userò SPSS, ma non me lo ricordo molto bene, quindi: in che modo SPSS gestisce questa situazione?
Inoltre, per una variabile categoriale ordinale, è una buona cosa usare variabili fittizie che ricreano la scala ordinale? (Ad esempio, utilizzando tre variabili dummy per una variabile ordinale 4-stato, messo 0-0-0
per il livello , per il livello , per il livello 3 e per il livello 4 , invece di , , e per i 4 livelli.)1-0-0
1-1-0
1-1-1
0-0-0
1-0-0
0-1-0
0-0-1