Qualcuno può fare luce su effetti misti lineari o non lineari?


14

Sto per tuffarmi nell'apprendimento di R e il mio progetto di apprendimento prevede l'applicazione di una regressione a effetti misti o casuali a un set di dati al fine di sviluppare un'equazione predittiva. Condivido la preoccupazione dello scrittore in questo post Come scegliere la libreria nlme o lme4 R per i modelli di effetti misti? nel chiedersi se NLME o LME4 sia il pacchetto migliore con cui familiarizzare. Una domanda più basilare è: qual è la differenza tra la modellazione lineare e non lineare di effetti misti?

Per lo sfondo, ho applicato la modellistica ME nella mia ricerca sulla SM (in MATLAB, non R), quindi ho familiarità con il modo in cui vengono trattate le variabili fisse e casuali. Ma non sono sicuro che il lavoro svolto sia stato considerato ME lineare o non lineare. È semplicemente la forma funzionale dell'equazione utilizzata o qualcos'altro?


Posso anche approfondire il lavoro svolto nella tesi di laurea specialistica.
Kevin,

Risposte:


17

Esistono diverse distinzioni tra i modelli di regressione lineare e non lineare, ma quello matematico principale è che i modelli lineari sono lineari nei parametri, mentre i modelli non lineari sono non lineari nei parametri. Pinheiro e Bates (2000, pp. 284-285), autori del nlmepacchetto R, descrissero elegantemente le considerazioni più sostanziali nella selezione del modello:

Quando si sceglie un modello di regressione per descrivere come una variabile di risposta varia con le covariate, si ha sempre la possibilità di usare modelli, come i modelli polinomiali, che sono lineari nei parametri. Aumentando l'ordine di un modello polinomiale, si possono ottenere approssimazioni sempre più accurate alla funzione di regressione vera, solitamente non lineare, all'interno dell'intervallo osservato dei dati. Questi modelli empirici si basano solo sulla relazione osservata tra la risposta e le covariate e non includono alcuna considerazione teorica sul meccanismo sottostante che produce i dati. I modelli non lineari, invece, sono spesso meccanicistici, cioè basati su un modello per il meccanismo che produce la risposta. Di conseguenza, i parametri del modello in un modello non lineare generalmente hanno un'interpretazione fisica naturale. Anche se derivati ​​empiricamente, i modelli non lineari di solito incorporano caratteristiche teoriche note dei dati, come asintoti e monotonicità, e in questi casi possono essere considerati modelli semi-meccanicistici. Un modello non lineare utilizza generalmente meno parametri rispetto a un modello lineare della concorrenza, come un polinomio, che fornisce una descrizione più parsimoniosa dei dati. I modelli non lineari forniscono anche previsioni più affidabili per la variabile di risposta al di fuori dell'intervallo osservato dei dati rispetto, ad esempio, ai modelli polinomiali. dando una descrizione più parsimoniosa dei dati. I modelli non lineari forniscono anche previsioni più affidabili per la variabile di risposta al di fuori dell'intervallo osservato dei dati rispetto, ad esempio, ai modelli polinomiali. dando una descrizione più parsimoniosa dei dati. I modelli non lineari forniscono anche previsioni più affidabili per la variabile di risposta al di fuori dell'intervallo osservato dei dati rispetto, ad esempio, ai modelli polinomiali.

Ci sono anche alcune grandi differenze tra i pacchetti nlme e lme4 che vanno oltre il problema della linearità. Ad esempio, utilizzando nlme è possibile adattare modelli lineari o non lineari e, per entrambi i tipi, specificare la varianza e le strutture di correlazione per errori all'interno del gruppo (ad esempio, autoregressivo); lme4 non può farlo. Inoltre, gli effetti casuali possono essere corretti o incrociati in entrambi i pacchetti, ma è molto più semplice (e più efficiente dal punto di vista computazionale) specificare e modellare gli effetti casuali incrociati in lme4.

Vorrei innanzitutto consigliare a) se sarà necessario un modello non lineare, e b) se sarà necessario specificare la varianza all'interno del gruppo o le strutture di correlazione. Se una qualsiasi di queste risposte è sì, allora devi usare nlme (dato che stai attaccando con R). Se lavori molto con modelli lineari con effetti casuali incrociati o combinazioni complicate di effetti casuali nidificati e incrociati, probabilmente lme4 è la scelta migliore. Potrebbe essere necessario imparare a utilizzare entrambi i pacchetti. Ho imparato prima lme4 e poi ho capito che dovevo usare nlme perché lavoro quasi sempre con strutture di errore autoregressive. Tuttavia, preferisco ancora lme4 quando analizzo i dati di esperimenti con fattori incrociati. La buona notizia è che gran parte di ciò che ho imparato su lme4 è stato trasferito bene su nme. In entrambi i casi,

Riferimenti

Pinheiro, JC e Bates, DM (2000). Modelli a effetti misti in S e S-PLUS . New York: Springer-Verlag.


Questa è una risposta eccellente; grazie mille per l'elaborazione. Ho appena trovato un altro riferimento per quel libro oggi e sicuramente lo rintraccerò ora che so che avrò bisogno di NLME.
Kevin,

Ottima risposta! Il tuo frammento di Pinheiro & Bates mi ha convinto che stasera avrò un libro da prendere in biblioteca ...
theforestecologist

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.