Questa è una domanda riguardante una pratica o un metodo seguito da alcuni dei miei colleghi. Durante la creazione di un modello di regressione logistica, ho visto le persone sostituire le variabili categoriali (o variabili continue che sono integrate) con il rispettivo Peso dell'evidenza (WoE). Questo è presumibilmente fatto per stabilire una relazione monotonica tra il regressore e la variabile dipendente. Ora, per quanto ho capito, una volta creato il modello, le variabili nell'equazione NON sono le variabili nel set di dati. Piuttosto, le variabili nell'equazione sono ora una specie di importanza o peso delle variabili nel separare la variabile dipendente !
La mia domanda è: come interpretiamo ora il modello o i coefficienti del modello? Ad esempio per la seguente equazione:
possiamo dire che è l' aumento relativo del rapporto dispari per 1 unità di aumento nella variabile .x 1
Ma se la variabile viene sostituita dal suo WoE, l'interpretazione verrà modificata in: aumento relativo del rapporto dispari per 1 unità di aumento dell'IMPORTANZA / PESO della variabile
Ho visto questa pratica su Internet, ma da nessuna parte ho trovato la risposta a questa domanda. Questo collegamento da questa stessa comunità è correlato a query in qualche modo simili in cui qualcuno ha scritto:
WoE mostra una relazione lineare con il logaritmo naturale del rapporto di probabilità che è la variabile dipendente nella regressione logistica. Pertanto, la questione della mancata specificazione del modello non si pone nella regressione logistica quando utilizziamo WoE invece dei valori effettivi della variabile.
Ma ancora non capisco la spiegazione. Per favore, aiutami a capire cosa mi sto perdendo.