Indietro trasformazione dei risultati di regressione durante la modellazione del registro (y)


11

Sto inserendo una regressione nel . È valido sostenere le stime dei punti di trasformazione (e gli intervalli di confidenza / previsione) mediante esponenziazione? Non ci credo, dato che E [ f ( X ) ] f ( E [ X ] ), ma voleva le opinioni degli altri.log(y)E[f(X)]f(E[X])

Il mio esempio di seguito mostra i conflitti con la trasformazione posteriore (.239 vs .219).

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

1
Non è questo uno dei problemi risolti dai GLM gaussiani collegati al log?
generic_user

@ARM Sì, ci credo. Grazie per la segnalazione. Tuttavia, usando GLM è più difficile ottenere intervalli di predizione, ma penso di riuscire a risolverlo.
Glen,

1
@Glen Effettua una ricerca di sbavature di Duan su questo sito.
Dimitriy V. Masterov,

Risposte:


13

Dipende da cosa vuoi ottenere dall'altra parte.

Un intervallo di confidenza per un parametro trasformato si trasforma bene. Se ha la copertura nominale sulla scala del log, avrà la stessa copertura sulla scala originale, a causa della monotonicità della trasformazione.

Anche un intervallo di previsione per una futura osservazione si trasforma bene.

Un intervallo per una media sulla scala del registro non sarà generalmente un intervallo adatto per la media sulla scala originale.

Tuttavia, a volte è possibile produrre esattamente o approssimativamente una stima ragionevole per la media sulla scala originale dal modello sulla scala del registro.

Tuttavia, è necessaria attenzione o potresti finire per produrre stime che hanno proprietà alquanto sorprendenti (ad esempio è possibile produrre stime che non hanno una media della popolazione; questa non è l'idea di tutti di una cosa buona).

exp(μi)exp(μi+12σ2)exp(μi^)exp(12σ2)

σ2

σ^2σ2exp(μi^)exp(12σ^2)exp(μi^)exp(12σ2)μi^μiexp(μi^)exp(μi)

Vedi qui .

Alcuni post correlati:

Trasformazione posteriore di un modello MLR

Trasformazione posteriore

Intervalli di confidenza trasformati all'indietro


1
Grazie, ho guardato i post precedenti e, sebbene illuminante, ero ancora un po 'confuso, quindi la mia domanda.
Glen,

12σ2^

1
E(Y)=0yf(y)dyfE(eX)X=logYXYt1,2,...

1
exetxe...x12

1
teμt+12σ2t2
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.