Qual è la distribuzione dell'errore attorno ai dati di crescita logistica?


10

In ecologia, usiamo spesso l'equazione della crescita logistica:

Nt=KN0ertK+N0ert1

o

Nt=KN0N0+(KN0)ert

dove è la capacità di carico (densità massima raggiunta), è la densità iniziale, è il tasso di crescita, è il tempo dall'iniziale.N 0 r tKN0rt

Il valore di ha un limite superiore morbido e un limite inferiore , con un limite inferiore forte a . ( K ) ( N 0 ) 0Nt(K)(N0)0

Inoltre, nel mio contesto specifico, le misurazioni di vengono eseguite usando densità ottica o fluorescenza, entrambe con un massimo teorico e quindi un forte limite superiore.Nt

L'errore attorno a è quindi probabilmente meglio descritto da una distribuzione limitata.Nt

A piccoli valori di , la distribuzione ha probabilmente una forte inclinazione positiva, mentre a valori di avvicinano a K, la distribuzione ha probabilmente una forte inclinazione negativa. La distribuzione quindi probabilmente ha un parametro di forma che può essere collegato a .N t N tNtNtNt

La varianza può anche aumentare con .Nt

Ecco un esempio grafico

inserisci qui la descrizione dell'immagine

con

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

che può essere prodotto in r con

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • Quale sarebbe la distribuzione teorica dell'errore intorno a (in considerazione sia del modello che delle informazioni empiriche fornite)?Nt

  • In che modo i parametri di questa distribuzione si relazionano al valore di o al tempo (se usando i parametri la modalità non può essere direttamente associata a ad es. normale)?N tNtNt

  • Questa distribuzione ha una funzione di densità implementata in ?R

Indicazioni esplorate finora:

  • Supponendo la normalità intorno a (porta a stime superiori di ) KNtK
  • Registra una distribuzione normale attorno a , ma difficoltà ad adattare i parametri di forma alfa e betaNt/max
  • Distribuzione normale attorno alla logica diNt/max

1
Concentrandosi sulla distribuzione dell'errore, questa domanda riflette un pensiero sofisticato su un modello, ma si noti che la distribuzione dell'errore per un modulo funzionale non ha necessariamente alcuna relazione con il modulo stesso. Gli ingredienti di una risposta valida si trovano invece nelle informazioni su come si verifica la crescita, sulle variazioni naturali di e nel tempo (che saranno necessariamente assorbite dall'errore), su possibili specifiche errate del modello e su come ( e ) vengono misurati. r N t tKrNtt
whuber

@whuber, ho provato a rispondere ad alcuni dei tuoi commenti in una recente modifica.
Etienne Low-Décarie

1
5 pensa che se puoi caratterizzare le proprietà della distribuzione del rumore come hai, puoi scegliere una forma parametrica con quelle proprietà. Penso che per riassumere la famiglia debba 1. essere definita su un intervallo finito, 2. consentire l'inclinazione a sinistra, l'inclinazione a destra e la simmetria. e 3. ha una varianza che aumenta all'aumentare di Nt. La distribuzione beta si adatta al conto per 1 e 2. L'intervallo fisso è [0, 1]. Quindi, per consentire l'aumento della varianza, potremmo aggiungere un parametro c che diffonde la distribuzione all'interv [0, c].
Michael R. Chernick,

Risposte:


3

Come ha sottolineato Michael Chernick, la distribuzione beta scalata ha il senso migliore per questo. Tuttavia, per tutti gli scopi pratici, e mi aspettavo che non lo farai MAIottenere il modello alla perfezione, sarebbe meglio modellare semplicemente la media tramite regressione non lineare in base all'equazione della crescita logistica e concluderla con errori standard robusti all'eteroschedasticità. Metterlo nel contesto della massima verosimiglianza creerà un falso sentimento di grande accuratezza. Se la teoria ecologica produrrebbe una distribuzione, dovresti adattarla. Se la tua teoria produce solo la previsione per la media, dovresti attenerti a questa interpretazione e non provare a trovare qualcosa di più di questo, come una vera e propria distribuzione. (Il sistema di curve di Pearson era sicuramente stravagante 100 anni fa, ma i processi casuali non seguono le equazioni differenziali per produrre le curve di densità, che era la sua motivazione con queste curve di densità - piuttosto,Nt stesso - sto pensando alla distribuzione di Poisson come esempio - e non sono del tutto sicuro che questo effetto verrà catturato dalla distribuzione beta scalata; al contrario, verrebbe compresso mentre tiri la media verso il suo limite superiore teorico, cosa che potresti dover fare. Se il dispositivo di misurazione ha un limite superiore delle misurazioni, ciò non significa che il processo effettivodeve avere un limite superiore; Preferirei dire che l'errore di misurazione introdotto dai tuoi dispositivi diventa critico man mano che il processo raggiunge quel limite superiore di essere misurato in modo ragionevolmente accurato. Se confondi la misurazione con il processo sottostante, dovresti riconoscerlo esplicitamente, ma immagino che tu abbia un interesse maggiore nel processo piuttosto che nel descrivere come funziona il tuo dispositivo. (Il processo sarà lì tra 10 anni; potrebbero essere disponibili nuovi dispositivi di misurazione, quindi il tuo lavoro diventerà obsoleto.)


Grazie mille! Concordo sul fatto che una separazione tra processo e misura sia interessante. Vorrei tuttavia suggerire che la maggior parte dei metodi di misurazione ha questo limite superiore forte, ma potrebbe essere importante isolarlo. Se dovessi utilizzare la versione beta ridimensionata, nonostante l'avvertimento sull'adeguatezza della MLE, qualche suggerimento su come mettere in relazione i parametri di forma con questo sistema per modellare le variabili per consentire la MLE?
Etienne Low-Décarie

Se sei convinto che i tuoi limiti siano davvero importanti nella tua applicazione, puoi semplicemente attenerti a questa beta ridimensionata. Tutto quello che sto dicendo è che non sono convinto. Esistono modelli per dati troncati, in cui tutto ciò che sai è che il valore effettivo supera il massimo che puoi misurare; a volte vengono utilizzati insieme alla migliore codifica dei redditi, mentre per motivi di riservatezza i redditi superiori a quelli di 100.000 USD / anno vengono ridotti a 100.000 USD / anno.
StasK

1

@whuber ha ragione nel dire che non esiste alcuna relazione necessaria tra la parte strutturale di questo modello e la distribuzione dei termini di errore. Quindi non esiste una risposta alla tua domanda per la distribuzione teorica dell'errore.

Ciò non significa che non sia una buona domanda, solo che la risposta dovrà essere in gran parte empirica.

Sembra che tu stia supponendo che la casualità sia additiva. Non vedo alcun motivo (a parte la convenienza computazionale) perché ciò avvenga. Un'alternativa è che c'è un elemento casuale da qualche altra parte nel modello? Ad esempio, vedere quanto segue, dove la casualità viene introdotta come normalmente distribuita con la media di 1, varianza l'unica cosa da stimare. Non ho motivo di pensare che questa sia la cosa giusta da fare oltre a quella che produce risultati plausibili che sembrano corrispondere a ciò che vuoi vedere. Non so se sarebbe pratico usare qualcosa di simile come base per stimare un modello.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

inserisci qui la descrizione dell'immagine


In questo caso, potresti avere valori Nt inferiori a zero e al di sopra del limite superiore rigido. Inoltre, il rumore è atteso in tutti i parametri (non necessariamente nel prodotto di un parametro con il tempo), quindi il rumore sulla variabile di risposta. Sarei comunque interessato all'interpretazione della massima verosimiglianza del tuo approccio.
Etienne Low-Décarie,

Ciò non consente di limitare la distribuzione per ogni Nt e non consente l'inclinazione del componente noise. Non so se la mia idea di una distribuzione beta scalata sia stata utilizzata in letteratura, ma soddisfi bene le restrizioni. Non l'ho provato, ma forse si potrebbe provare la massima probabilità. Non sono sicuro, ma forse ci sarebbe un problema se c fosse incluso nella stima della probabilità. Forse c potrebbe essere stimato separatamente basandosi solo su Nt e quindi il resto del modello potrebbe adattarsi alla massima probabilità per ogni Nt fisso.
Michael R. Chernick,

Sto solo pensando ad alta voce. Qualcuno pensa che questo problema potrebbe essere trasformato in un buon documento di ricerca?
Michael R. Chernick,

Un articolo del 1966 lo esaminò un po ', ma non ne ho visto uno più recente. Forse le cose sono cambiate da allora? jstor.org/discover/10.2307/…
Etienne Low-Décarie

Per favore fatemi sapere se decidete di seguire questa strada.
Etienne Low-Décarie,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.