Regressione con solo variabili categoriali


24

È possibile condurre una regressione se tutte le variabili dipendenti e indipendenti sono variabili categoriali?


3
È certamente possibile, anche per la regressione comune o del giardino, purché la variabile di risposta (dipendente) sia trattata in modo puramente numerico. A seconda del software, potrebbe essere necessario spingerlo o forzarlo. Con una definizione adeguatamente ampia di regressione, per includere la regressione logistica o ordinale, non è solo possibile, è un luogo comune.
Nick Cox,

Risposte:


31

Dobbiamo essere chiari sui nostri termini qui, ma in generale :

  • Se la tua variabile dipendente è continua (e i residui sono normalmente distribuiti, vedi qui ), ma tutte le tue variabili indipendenti sono categoriali, questo è solo un ANOVA .
  • Se la variabile dipendente è categorica e le variabili indipendenti sono continue, si tratterebbe di regressione logistica (possibilmente binaria, ordinale o multinomiale , a seconda).
  • Se sia la variabile dipendente sia le variabili indipendenti sono variabili categoriali, è comunque possibile utilizzare la regressione logistica: è una specie della versione di LR ANOVA.

Si noti che sia la regressione logistica sia la regressione dei minimi quadrati ordinari (lineari) sono casi speciali del Modello lineare generalizzato .


È il terzo caso che hai menzionato, ho provato LR, nessuno dei coefficienti è risultato significativo. Ho pensato che potrei fare qualcosa di sbagliato.
altruista,

2
Non penso che ANOVA richieda una variabile dipendente continua non più di quanto richieda residui normalmente distribuiti. Queste sono solo condizioni in cui si prevede che ANOVA funzioni bene.
Nick Cox,

1
@NickCox, hai ragione, ovviamente; stiamo cavillando su come definiamo e applichiamo questi termini. Il modo in cui lo direi è che il modello è derivato da questi presupposti, ma ANOVA può essere utilizzato anche se non sono soddisfatti, con la domanda se i risultati saranno utili a seconda.
gung - Ripristina Monica

1
@altruist, ho esposto i tre casi per motivi di chiarezza concettuale; Riconosco che l'ultimo è quello che vuoi. Si noti che se si utilizza o meno il software correttamente per adattarlo al modello e se i coefficienti sono o meno "significativi" non è correlato al fatto che LR sia o meno il modello appropriato per la propria situazione.
gung - Ripristina Monica

4
Si noti che essere categorici a volte è una questione di definizione per il software, e talvolta nella mente di chi guarda. Qual è il numero di bambini, ad esempio?
Nick Cox,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.