Posso usare la regressione multipla quando ho misurato predittori categorici e continui?

12

Sembra che tu possa usare la codifica per una variabile categoriale, ma ho due variabili predittive categoriche e una continua. Posso utilizzare la regressione multipla per questo in SPSS e, in caso affermativo, come? Grazie!

Sono sicuro che puoi , ma temo di non avere idea di come !

— onestop il

Suggerirei di digitare qualcosa come la regressione nella documentazione di aiuto fornita con SPSS. Dovrebbe essere roba da pane e burro per qualsiasi pacchetto di statistiche

— Probislogic

Non so cosa intendi con la codifica per una variabile categoriale. Puoi fare un esempio in sintassi? La tua variabile dipendente è continua o categorica?

— Andy W,

8

Se questa è una domanda di sintassi SPSS, la risposta è semplicemente inserire la variabile categoriale, codificata in modo appropriato, nell'elenco delle variabili "indipendenti" insieme a quella continua.
Sulle statistiche: la tua variabile categoriale è binaria? In tal caso, è necessario utilizzare un manichino o un altro codice di contrasto valido. Se non è binario, la tua variabile categoriale è ordinale o nominale? Se nominale, quindi di nuovo, è necessario utilizzare una strategia di codice contrastante - in effetti modellare l'impatto di ciascun livello della variabile sul risultato o variabile "dipendente". Se la variabile categoriale è ordinale, molto probabilmentela cosa sensata da fare è inserirla così com'è nel modello, proprio come si farebbe con una variabile predittiva continua (cioè "indipendente"). Supponeresti, in tal caso, che gli incrementi tra i livelli della variabile di predittore categoriale ("indipdente"); solo raramente questo sarà un errore, ma quando lo è, dovresti usare nuovamente un codice di contrasto e modellare l'impatto di ogni livello. Questa domanda viene posta abbastanza spesso in questo forum: ecco una buona analisi
Il modo in cui gestire i dati mancanti è, a mio avviso, una questione completamente separata. La mia comprensione è che la cancellazione a coppie non è vista come un approccio valido per la regressione multivariata. Listwise è piuttosto comune ma può anche distorcere i risultati e sicuramente è un peccato. L'imputazione multipla è una cosa di bellezza.

— dmk38
fonte

Ho una domanda per DMK38. Sopra scrivi che è ok aggiungere una variabile categoriale in un modello così com'è quando è ordinale. Sono felice di leggere questo ;-) Hai una buona fonte che menziona anche quello in modo da poterlo aggiungere al mio documento? Grazie mille per la tua risposta! Lilian

— Lilian Jans-Beken

1

@ LilianJans-Beken: vedi Variabile dipendente continua con variabile indipendente ordinale e regressione logistica e variabili ordinali indipendenti . Potresti non voler optare per i metodi più complicati, ma tieni presente che anche se sei felice di considerare il predittore come scalato in base all'intervallo, non è necessario vincolarlo per avere una relazione lineare con la risposta. E non sentirti obbligato ad assumere intervalli uguali tra livelli contigui se qualcos'altro sembra più sensato.

— Scortchi - Ripristina Monica

1

@ LilianJans-Beken: anche come gestire la variabile categoriale ordinale come variabile indipendente e Logit con variabili ordinali indipendenti . Oh, benvenuto a Cross Validated!

— Scortchi - Ripristina Monica

2

Puoi sicuramente, seguendo lo stesso metodo che utilizzeresti per il primo predittore categorico. Crea variabili fittizie proprio come faresti per la prima di tali variabili. Ma spesso è più facile usare il comando Unianova di SPSS. Puoi cercarlo in qualsiasi Guida alla sintassi stampata o pdf, oppure puoi accedervi tramite Analizza ... Modello lineare generale ... Univariato.

Nonostante sia un po 'più complicato, il comando Regressione presenta numerosi vantaggi rispetto a Unianova. Il principale è che puoi scegliere 'perdere in coppia' (non devi perdere un caso semplicemente perché manca un valore per uno o due predittori). Puoi anche ottenere molte preziose diagnosi come grafici parziali e statistiche di influenza.

— rolando2
fonte

1

@ rolando - buona risposta. Detto questo, gli approcci mancanti a coppie tendono a confondere il confronto degli effetti, poiché si basano su diversi numeri di osservazioni. Potrebbe essere qualcosa da tenere a mente.

— richiemorrisroe,

Penso che la tua mancanza leggermente confusa, in termini di coppia, sia importante solo se stai eseguendo modelli completamente separati (come ad esempio utilizzando una procedura di selezione dei modelli in base al passo). Se si immettono tutte le variabili nel modello, vengono comunque eliminati i valori mancanti nell'elenco.

— Andy W,

@ richiemorrisroe - sono d'accordo, vale la pena ricordare. @ Andy W - Ho appena confermato in SPSS che, usando solo l'immissione forzata, la mancanza a coppie e la mancanza a livello di lista danno risultati diversi sotto tutti gli aspetti, inclusi diversi df.

— rolando2,

Continuo a pensare che tu sia confuso, come può SPSS restituire diversi insiemi di risultati dichiarando mancanti a coppie a meno che non crei valori per i dati mancanti? Ecco un esempio usando i dati simulati che ho pubblicato in un file di testo, dl.dropbox.com/u/3385251/SPSS_missing_Listwise_vs_Pairwise.txt . Al momento ho annullato la valutazione della tua risposta, poiché tutto questo parlare di come il comando di regressione gestisce i dati mancanti è confuso, non ha nulla a che fare con la domanda originale del PO ed è probabile che sia fuorviante.

— Andy W,

1

Un modo semplice per trasformare le variabili categoriali in un insieme di variabili fittizie da utilizzare nei modelli in SPSS è utilizzare la sintassi do repeat. Questo è il più semplice da usare se le variabili categoriali sono in ordine numerico.

*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode. 
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute.

Altrimenti puoi semplicemente eseguire una serie di istruzioni if per creare variabili fittizie. La mia versione attuale (16) non ha la capacità nativa di specificare automaticamente un set di variabili fittizie nel comando di regressione (come puoi fare in Stata usando il comando xi ) ma non sarei sorpreso se questo fosse disponibile in una versione più recente. Prendi anche nota del punto n. 2 di dmk38, questo schema di codifica assume categorie nominali. Se la variabile è ordinale, è possibile utilizzare una maggiore discrezione.

Concordo anche con dmk38 e la discussione sulla regressione è migliore a causa della sua capacità di specificare i dati mancanti in un modo particolare è un problema completamente separato.

— Andy W.
fonte