Errore additivo o errore moltiplicativo?


13

Sono relativamente nuovo alle statistiche e gradirei aiutarlo a capirlo meglio.

Nel mio campo c'è un modello comunemente usato del modulo:

Pt=Po(Vt)α

Quando le persone adattano il modello ai dati, di solito lo linearizzano e si adattano a quanto segue

log(Pt)=log(Po)+αlog(Vt)+ε

Va bene? Ho letto da qualche parte che a causa del rumore nel segnale dovrebbe essere il modello reale

Pt=Po(Vt)α+ε

e questo non può essere linearizzato come sopra. È vero? In tal caso, qualcuno conosce un riferimento che posso leggere e saperne di più su di esso e probabilmente citare in un rapporto?


Ho formattato le tue equazioni. Controlla se il contenuto è ancora quello che volevi (specialmente per quanto riguarda gli abbonamenti).
Andy,

Hai contrassegnato la tua domanda con "errore di misurazione" e il + e nella terza equazione sembrerebbe essere dovuto a un errore di misurazione additivo oltre alla variazione stocastica / casuale moltiplicativa nella risposta, qualcosa come P * (V ^ alpha) * exp (e). È corretto? I modelli di errore di misurazione (noti anche come modelli di "errore nelle variabili") richiedono spesso una sorta di processo in due fasi, che nel tuo caso potrebbe richiedere dati di convalida separati per caratterizzare l'errore aggiuntivo dovuto al "rumore", nel qual caso potrebbe non esserci un è necessario linearizzare l'equazione.
N Brouwer,

Risposte:


14

Quale modello è appropriato dipende da come varia l'osservazione della media nelle osservazioni. Potrebbe anche venire in modo moltiplicativo o additivo ... o in qualche altro modo.

Possono esserci anche diverse fonti di questa variazione, alcune che possono entrare in modo moltiplicativo e altre che entrano in modo additivo e altre in modi che non possono essere realmente caratterizzati.

A volte c'è una teoria chiara per stabilire quale sia adatto. A volte meditando sulle principali fonti di variazione della media si rivelerà una scelta appropriata. Spesso le persone non hanno la chiara idea di quale utilizzare o se possono essere necessarie diverse fonti di variazione di diverso tipo per descrivere adeguatamente il processo.

Con il modello log-lineare, in cui viene utilizzata la regressione lineare:

log(Pt)=log(Po)+αlog(Vt)+ε

il modello di regressione OLS presuppone una varianza costante della scala dei log e, in tal caso, i dati originali mostreranno una diffusione crescente sulla media all'aumentare della media.

D'altra parte, questo tipo di modello:

Pt=Po(Vt)α+ε

viene generalmente applicato da minimi quadrati non lineari e, di nuovo, se viene adattata la varianza costante (impostazione predefinita per NLS), la diffusione attorno alla media dovrebbe essere costante.

inserisci qui la descrizione dell'immagine

[Potresti avere l'impressione visiva che la diffusione stia diminuendo con l'aumentare della media nell'ultima immagine; questa è in realtà un'illusione causata dalla crescente pendenza - tendiamo a giudicare la diffusione ortogonale alla curva piuttosto che in verticale, in modo da avere un'impressione distorta.]

Se la diffusione è quasi costante sull'originale o sulla scala del registro, ciò potrebbe suggerire quale dei due modelli si adatta, non perché dimostra che è additivo o moltiplicativo, ma perché porta a una descrizione appropriata della diffusione e al significare.

Naturalmente si potrebbe anche avere la possibilità di un errore additivo con varianza non costante.

Tuttavia, ci sono ancora altri modelli in cui possono essere adattati tali rapporti funzionali che hanno relazioni diverse tra media e varianza (come un GLM di Poisson o quasi-Poisson, che si è diffuso in modo proporzionale alla radice quadrata della media).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.