La mia situazione è:
Ho 1 variabile continua dipendente e 1 variabile predittore continua che ho trasformato logaritmicamente per normalizzare i loro residui per una semplice regressione lineare.
Gradirei qualsiasi aiuto su come posso collegare queste variabili trasformate al loro contesto originale.
Voglio utilizzare una regressione lineare per prevedere il numero di giorni in cui gli alunni hanno perso la scuola nel 2011 in base al numero di giorni persi nel 2010. La maggior parte degli alunni perde 0 giorni o solo pochi giorni i dati sono distorti positivamente a sinistra. Pertanto, è necessaria una trasformazione per utilizzare la regressione lineare.
Ho usato log10 (var + 1) per entrambe le variabili (ho usato +1 per gli alunni che avevano perso la scuola per 0 giorni). Sto usando la regressione perché voglio aggiungere fattori categorici - genere / etnia ecc.
Il mio problema è:
Il pubblico a cui voglio rispondere non capirà log10 (y) = log (costante) + log (var2) x (e francamente nemmeno io).
Le mie domande sono:
a) Esistono modi migliori per interpretare le variabili trasformate in regressione? Vale a dire per sempre 1 giorno perso nel 2010, mancheranno 2 giorni nel 2011, invece di 1 cambio unità di registro nel 2010 ci sarà un cambio di x unità di registro nel 2011?
b) In particolare, dato il passaggio citato da questa fonte come segue:
"Questa è la stima della regressione binomiale negativa per un aumento di una unità nel punteggio del test matematico standardizzato, date le altre variabili mantenute costanti nel modello. Se uno studente dovesse aumentare il suo punteggio del test matematico di un punto, la differenza nei registri di i conteggi previsti dovrebbero diminuire di 0,0016 unità, mantenendo le altre variabili nella costante del modello ".
Mi piacerebbe sapere:
- Questo passaggio sta dicendo che per ogni aumento di unità del punteggio della
UNTRANSFORMED
matematica variabile si ottiene una diminuzione di 0,0016 dalla costante (a), quindi se ilUNTRANSFORMED
punteggio di matematica aumenta di due punti, sottraggo 0,0016 * 2 dalla costante a? - Vuol dire che ottengo la media geometrica usando esponenziale (a)) ed esponenziale (a + beta * 2) e che devo calcolare la differenza percentuale tra questi due per dire quale effetto hanno le variabili predittive / avere sulla variabile dipendente?
- O ho sbagliato totalmente?
Sto usando SPSS v20. Ci scusiamo per averlo inquadrato in una lunga domanda.
R
ha pacchetti per modelli a gonfiaggio zero; cerca in questo sito .)