Stima del modello esponenziale


10

Un modello esponenziale è un modello descritto dalla seguente equazione:

yi^=β0eβ1x1i++βkxki

L'approccio più comune utilizzato per stimare tale modello è la linearizzazione, che può essere eseguita facilmente calcolando i logaritmi di entrambi i lati. Quali sono gli altri approcci? Sono particolarmente interessato a quelli che possono gestire in alcune osservazioni.yi=0

Aggiornamento 31.01.2011
Sono consapevole del fatto che questo modello non può produrre zero. Elaborerò un po 'quello che sto modellando e perché scelgo questo modello. Diciamo che vogliamo prevedere quanti soldi spende un cliente in un negozio. Naturalmente molti clienti stanno solo cercando e non comprano nulla, ecco perché ci sono 0. Non volevo usare il modello lineare perché produce molti valori negativi, il che non ha alcun senso. L'altra ragione è che questo modello funziona davvero bene, molto meglio di quello lineare. Ho usato l'algoritmo genetico per stimare quei parametri, quindi non era un approccio "scientifico". Ora vorrei sapere come affrontare il problema usando metodi più scientifici. Si può anche presumere che la maggior parte, o addirittura tutte, delle variabili siano variabili binarie.


1
se ci sono zero nei tuoi dati, la regressione esponenziale potrebbe non essere appropriata, dal momento che il modello come hai affermato non può consentire di osservare valori zero.
mpiktas,

Risposte:


11

Ci sono diversi problemi qui.

(1) Il modello deve essere esplicitamente probabilistico . In quasi tutti i casi non ci sarà un insieme di parametri per i quali lhs corrisponde a rhs per tutti i tuoi dati: ci saranno residui. È necessario formulare ipotesi su tali residui. Ti aspetti che siano zero in media? Da distribuire simmetricamente? Da distribuire approssimativamente normalmente?

Qui ci sono due modelli che concordano con quello specificato ma consentono un comportamento residuo drasticamente diverso (e pertanto generano stime di parametri differenti). Puoi variare questi modelli variando ipotesi sulla distribuzione congiunta di :ϵi

B:y i =β 0 exp ( β 1 x 1 i + + β k x k i ) +ϵ io .

A: yi=β0exp(β1x1i++βkxki+ϵi)
B: yi=β0exp(β1x1i++βkxki)+ϵi.

(Si noti che questi sono modelli per i dati ; di solito non esiste un valore di dati stimato .)^ y iyiyi^

(2) La necessità di gestire valori zero per y implica che il modello dichiarato (A) è sia sbagliato che inadeguato , poiché non può produrre un valore zero indipendentemente dall'errore casuale. Il secondo modello sopra (B) consente valori zero (o addirittura negativi) di y. Tuttavia, non si dovrebbe scegliere un modello esclusivamente su tale base. Per ribadire # 1: è importante modellare gli errori ragionevolmente bene.

(3) La linearizzazione cambia il modello . In genere, risulta in modelli come (A) ma non come (B). È utilizzato da persone che hanno analizzato i loro dati abbastanza da sapere che questo cambiamento non influirà in modo sensibile sulle stime dei parametri e da persone che ignorano ciò che sta accadendo. (È difficile, molte volte, dire la differenza.)

(4) Un modo comune per gestire la possibilità di un valore zero è di proporre che (o una sua reespressione, come la radice quadrata) abbia una probabilità strettamente positiva di ugualmente zero. Matematicamente, stiamo mescolando una massa di punti (una "funzione delta") con un'altra distribuzione. Questi modelli si presentano così:y

f(yi)F(θ);θj=βj0+βj1x1i++βjkxki

dove è uno dei parametri impliciti nel vettore , è una famiglia di distribuzioni parametrizzate da , ed è la ri-espressione del 's (la funzione "link" di un modello lineare generalizzato: si veda la risposta del onestop). (Naturalmente, quindi, = quando ) Esempi sono i modelli Poisson zero e binomiali negativi .PrFθ[f(Y)=0]=θj+1>0θFθ1,,θjfyPrFθ[f(Y)t](1θj+1)Fθ(t)t0

(5) Le questioni relative alla costruzione di un modello e al suo adattamento sono correlate ma diverse . Come semplice esempio, anche un normale modello di regressione può essere adattato in molti modi per mezzo di minimi quadrati (che forniscono le stesse stime dei parametri della massima verosimiglianza e quasi gli stessi errori standard), minimi quadrati ripetuti in modo iterativo , varie altre forme di " minimi quadrati robusti " , ecc. La scelta del montaggio si basa spesso su convenienza, convenienza ( ad es . disponibilità di software), familiarità, abitudine o convenzione, ma almeno alcuni pensieri dovrebbero essere dato a ciò che è appropriato per la presunta distribuzione dei termini di errore , a ciò che ilϵ iY=β0+β1X+ϵϵila funzione di perdita per il problema potrebbe ragionevolmente essere e la possibilità di sfruttare informazioni aggiuntive (come una distribuzione preventiva per i parametri).


10

Questo è un modello lineare generalizzato (GLM) con una funzione di collegamento log .

Qualsiasi distribuzione di probabilità su con densità diversa da zero a zero gestirà in alcune osservazioni; il più comune sarebbe la distribuzione di Poisson, con conseguente regressione di Poisson , alias modellazione log-lineare. Un'altra scelta sarebbe una distribuzione binomiale negativa .y i = 0[0,)yi=0

Se non si dispone di dati di conteggio o se accetta valori non interi, è comunque possibile utilizzare il framework di modelli lineari generalizzati senza specificare completamente una distribuzione per ma invece solo specificare la relazione tra la sua media e la varianza usando quasi-verosimiglianza . P ( y i | x )yiP(yi|x)


Peccato che non mi sia stato insegnato al riguardo all'università: / Sembra che sarà utile in questo caso, ma ho bisogno di un po 'di tempo per approfondire i dettagli. Grazie!
Tomek Tarczynski,

Si noti che può sempre essere ridimensionato a valori interi quando è razionale, ad esempio misurare pence / centesimi anziché sterline / dollari. Anche se potresti voler arrotondare alla sterlina / dollaro più vicina comunque poiché la distribuzione della parte pence / centesimi del prezzo dei beni sarà probabilmente molto irregolare (cioè principalmente 99). yi
James,

3

Puoi sempre usare i minimi quadrati non lineari . Quindi il tuo modello sarà:

yi=β0exp(β1x1i+...+βkxki)+εi

Gli zeri in verranno quindi trattati come deviazioni dalla tendenza non lineare.yi


Che dire dei valori iniziali dei parametri? Qual è il buon modo per sceglierli? Come ho affermato in un aggiornamento, si può presumere che non vi siano variabili continue.
Tomek Tarczynski,

@Tomek, penso che non ci sia un buon modo per sceglierli. Di solito dipende dai dati. Suggerisco media per l'intercetta e zero per altri coefficienti.
mpiktas,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.