Come calcolare l'intervallo di confidenza al 95% per l'equazione non lineare?


10

Ho un'equazione per prevedere il peso dei lamantini della loro età, in giorni (dias, in portoghese):

R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias))

L'ho modellato in R, usando nls (), e ho ottenuto questo grafico:

inserisci qui la descrizione dell'immagine

Ora voglio calcolare l'intervallo di confidenza al 95% e tracciarlo nel grafico. Ho usato i limiti inferiore e superiore per ogni variabile a, bec, in questo modo:

lower a = a - 1.96*(standard error of a)
higher a = a + 1.96*(standard error of a)
(the same for b and c)

quindi tracciamo una linea inferiore usando a, b, c più bassa e una linea più alta usando a, b, c più alta. Ma non sono sicuro che sia il modo giusto per farlo. Mi sta dando questo grafico:

inserisci qui la descrizione dell'immagine

È questo il modo di farlo o sto sbagliando?

Risposte:


13
  1. Questo QA su questo sito spiega la matematica per creare bande di confidenza attorno alle curve generate dalla regressione non lineare: forma di confidenza e intervalli di previsione per la regressione non lineare

  2. Se leggi oltre, aiuterà a distinguere gli intervalli di confidenza per i parametri dalle bande di confidenza per la curva.

  3. Guardando il tuo grafico, sembra che tu abbia dati da quattro animali, misurandoli per molti giorni. In tal caso, l'adattamento di tutti i dati in una sola volta viola una delle ipotesi di regressione - che ogni punto di dati sia indipendente (o che ogni residuo abbia un "errore" indipendente). Potresti prendere in considerazione la possibilità di adattare individualmente la traccia di ciascun animale o utilizzare un modello misto per adattarli tutti in una volta.


5
+1 Il terzo punto è cruciale: qualsiasi sforzo per calcolare gli EC o le bande di confidenza supponendo che questi dati siano indipendenti produrrà intervalli dolorosamente inadeguati (cioè brevi ). Potrebbe aiutare l'OP a sottolineare che il metodo proposto nella domanda è decisamente sbagliato: trascura la (forte) correlazione tra le stime dei parametri e aggrega i limiti di confidenza in modo errato. Il risultato netto sembra in realtà ragionevole (puramente per caso e per fortuna) ma ai miei occhi non è ancora sufficientemente conservativo.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.