Come ridurre al minimo la somma residua dei quadrati di un adattamento esponenziale?

Ho i seguenti dati e vorrei adattare un modello di crescita esponenziale negativo ad esso:

Days <- c( 1,5,12,16,22,27,36,43)
Emissions <- c( 936.76, 1458.68, 1787.23, 1840.04, 1928.97, 1963.63, 1965.37, 1985.71)
plot(Days, Emissions)
fit <- nls(Emissions ~ a* (1-exp(-b*Days)), start = list(a = 2000, b = 0.55))
curve((y = 1882 * (1 - exp(-0.5108*x))), from = 0, to =45, add = T, col = "green", lwd = 4)

Il codice funziona e viene tracciata una linea di adattamento. Tuttavia, la misura visivamente non è l'ideale e la somma residua dei quadrati sembra essere piuttosto grande (147073).

Come possiamo migliorare la nostra forma? I dati consentono un adattamento migliore a tutti?

Non siamo riusciti a trovare una soluzione a questa sfida in rete. Qualsiasi aiuto diretto o collegamento ad altri siti Web / post è molto apprezzato.

r nonlinear-regression fitting nls

— Strohmi
fonte

In questo caso, se si considera un modello di regressione

, dove

, si ottengono stimatori simili. Tracciando le aree di confidenza, si può osservare come questi valori sono contenuti nelle regioni di confidenza. Non puoi aspettarti un adattamento perfetto se non interpoli i punti o usi un modello non lineare più flessibile.

{Emissions}_{i} = f ({Days}_{i}, a, b) + ϵ_{i}

$\text{Emissions}_i=f(\text{Days}_i,a,b)+\epsilon_i$

ϵ_{i} \sim N (0, σ)

$\epsilon_i\sim N(0,\sigma)$

Ho cambiato il titolo perché "modello esponenziale negativo" significa qualcosa di diverso da quello descritto nella domanda.

— whuber

Grazie per aver chiarito la domanda (@whuber) e grazie per la risposta (@Procrastinator). Come posso calcolare e tracciare le aree di confidenza. E quale sarebbe un modello non lineare più flessibile?

— Strohmi,

Hai bisogno di un parametro aggiuntivo. Guarda cosa succede con

fit <- nls(Emissions ~ a* (1- u*exp(-b*Days)), start = list(a = 2000, b = 0.1, u=.5));  beta <- coefficients(fit); curve((y = beta["a"] * (1 - beta["u"] * exp(-beta["b"]*x))), add = T)

— whuber

@whuber - forse dovresti pubblicarlo come risposta?

— jbowman,

Una legge esponenziale (negativa) assume la forma . Quando si consentono cambiamenti di unità nei valori e , tuttavia, dire a e , quindi la legge sarà espressa come $y=-\exp(-x)$ $x$ $y$ $y = \alpha y' + \beta$ $x = \gamma x' + \delta$

α y^{'} + β = y = - \exp (- X) = - \exp (- γ X^{'} - δ),

$\alpha y' + \beta = y = -\exp(-x) = -\exp(-\gamma x' - \delta),$

algebricamente equivalente

y^{'} = \frac{- 1}{α} \exp (- γ x^{'} - δ) - β = a (1 - u \exp (- b x^{'}))

$y' = \frac{-1}{\alpha} \exp(-\gamma x' - \delta) - \beta = a\left(1 - u\exp(-b x')\right)$

usando tre parametri , e . Possiamo riconoscere come parametro di scala per , come un parametro di scala per , ed come derivanti da una posizione parametro $a = -\beta/\alpha$ $u = 1/(\beta\exp(\delta))$ $b = \gamma$ $a$ $y$ $b$ $x$ $u$ $x$ .

Come regola generale, questi parametri possono essere identificati a colpo d'occhio dalla trama :

Il parametro è il valore dell'asintoto orizzontale, un po 'meno di . $a$ $2000$
Il parametro è la quantità relativa che la curva sale dall'origine al suo asintoto orizzontale. Qui, l'aumento è quindi leggermente inferiore a ; relativamente, questo è circa dell'asintoto. $u$ $2000 - 937$ $0.55$
Poiché , quando pari a tre volte il valore di la curva dovrebbe essere salita a circa o al del suo totale. dell'aumento dal a quasi ci colloca intorno al ; la scansione della trama indica che sono stati necessari dai ai giorni. Chiamiamolo per semplicità, da cui $\exp(-3) \approx 0.05$ $x$ $1/b$ $1-0.05$ $95\%$ $95\%$ $937$ $2000$ $1950$ $20$ $25$ $24$ . (Questometodo al per il bulbo oculare di una scala esponenziale è standard in alcuni campi che usano molto i grafici esponenziali.) $b \approx 3/24 = 0.125$ $95\%$

Vediamo come appare:

plot(Days, Emissions)
curve((y = 2000 * (1 - 0.56 * exp(-0.125*x))), add = T)

Fit bulbo oculare

Non male come inizio! (Anche se si digita 0.56al posto di 0.55, che era comunque un'approssimazione approssimativa.) Possiamo lucidarlo con nls:

fit <- nls(Emissions ~ a * (1- u * exp(-b*Days)), start=list(a=2000, b=1/8, u=0.55))
beta <- coefficients(fit)
plot(Days, Emissions)
curve((y = beta["a"] * (1 - beta["u"] * exp(-beta["b"]*x))), add = T, col="Green", lwd=2)

Vestibilità NLS

L'output di nlscontiene informazioni dettagliate sull'incertezza dei parametri. Ad esempio , un semplice summaryfornisce errori standard di stima:

> summary(fit)

Parameters:
   Estimate Std. Error t value Pr(>|t|)    
a 1.969e+03  1.317e+01  149.51 2.54e-10 ***
b 1.603e-01  1.022e-02   15.69 1.91e-05 ***
u 6.091e-01  1.613e-02   37.75 2.46e-07 ***

Possiamo leggere e lavorare con l'intera matrice di covarianza delle stime, utile per stimare intervalli di confidenza simultanei (almeno per grandi set di dati):

> vcov(fit)
             a             b             u
a 173.38613624 -8.720531e-02 -2.602935e-02
b  -0.08720531  1.044004e-04  9.442374e-05
u  -0.02602935  9.442374e-05  2.603217e-04

nls supporta grafici di profilo per i parametri, fornendo informazioni più dettagliate sulla loro incertezza:

> plot(profile(fit))

$a$

Trama del profilo

$2$ $1945$ $1995$

— whuber
fonte

res <- residuals(fit); res %*% res

u

$u$

2724

$2724$

147073

$147073$

Tutto bene e buono whuber. Ma forse l'OP aveva qualche motivo per scegliere il modello esponenziale (o forse è solo perché è ben noto). Penso che prima i residui debbano essere esaminati per il modello esponenziale. Tracciali contro potenziali covariate per vedere se c'è struttura lì e non solo un grande rumore casuale. Prima di saltare su modelli più sofisticati, prova a vedere se un modello più elaborato potrebbe aiutare.

— Michael R. Chernick,

x

$x$

Non stavo criticando la tua risposta! Non ho visto alcun diagramma residuo. Tutto ciò che stavo suggerendo è che le trame di residui vs potenziali covariate dovrebbero essere il primo passo per trovare un modello migliore. Se avessi pensato di avere una risposta da mettere lì avrei dato una risposta piuttosto che sollevare il mio punto di vista come costante. Pensavo avessi dato un'ottima risposta ed ero tra quelli che ti hanno dato +1.

— Michael R. Chernick,