Sembra che tu possa usare la codifica per una variabile categoriale, ma ho due variabili predittive categoriche e una continua. Posso utilizzare la regressione multipla per questo in SPSS e, in caso affermativo, come? Grazie!
Sembra che tu possa usare la codifica per una variabile categoriale, ma ho due variabili predittive categoriche e una continua. Posso utilizzare la regressione multipla per questo in SPSS e, in caso affermativo, come? Grazie!
Risposte:
Puoi sicuramente, seguendo lo stesso metodo che utilizzeresti per il primo predittore categorico. Crea variabili fittizie proprio come faresti per la prima di tali variabili. Ma spesso è più facile usare il comando Unianova di SPSS. Puoi cercarlo in qualsiasi Guida alla sintassi stampata o pdf, oppure puoi accedervi tramite Analizza ... Modello lineare generale ... Univariato.
Nonostante sia un po 'più complicato, il comando Regressione presenta numerosi vantaggi rispetto a Unianova. Il principale è che puoi scegliere 'perdere in coppia' (non devi perdere un caso semplicemente perché manca un valore per uno o due predittori). Puoi anche ottenere molte preziose diagnosi come grafici parziali e statistiche di influenza.
Un modo semplice per trasformare le variabili categoriali in un insieme di variabili fittizie da utilizzare nei modelli in SPSS è utilizzare la sintassi do repeat. Questo è il più semplice da usare se le variabili categoriali sono in ordine numerico.
*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode.
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute.
Altrimenti puoi semplicemente eseguire una serie di istruzioni if per creare variabili fittizie. La mia versione attuale (16) non ha la capacità nativa di specificare automaticamente un set di variabili fittizie nel comando di regressione (come puoi fare in Stata usando il comando xi ) ma non sarei sorpreso se questo fosse disponibile in una versione più recente. Prendi anche nota del punto n. 2 di dmk38, questo schema di codifica assume categorie nominali. Se la variabile è ordinale, è possibile utilizzare una maggiore discrezione.
Concordo anche con dmk38 e la discussione sulla regressione è migliore a causa della sua capacità di specificare i dati mancanti in un modo particolare è un problema completamente separato.