MLE richiede dati iid? O solo parametri indipendenti?


16

La stima dei parametri utilizzando la stima della massima verosimiglianza (MLE) implica la valutazione della funzione di verosimiglianza, che mappa la probabilità che il campione (X) si verifichi ai valori (x) sullo spazio dei parametri (θ) data una famiglia di distribuzione (P (X = x | θ ) su possibili valori di θ (nota: ho ragione su questo?). Tutti gli esempi che ho visto riguardano il calcolo di P (X = x | θ) prendendo il prodotto di F (X) dove F è la distribuzione con il locale il valore per θ e X è il campione (un vettore).

Poiché stiamo solo moltiplicando i dati, ne consegue che i dati sono indipendenti? Ad esempio, non è possibile utilizzare MLE per adattare i dati delle serie temporali? O i parametri devono solo essere indipendenti?

Risposte:


14

La funzione di probabilità è definita come la probabilità di un evento (set di dati x ) in funzione dei parametri del modello θExθ

L(θ;x)P(Event E;θ)=P(observing x;θ).

Pertanto, non vi è alcuna ipotesi di indipendenza delle osservazioni. Nell'approccio classico non esiste una definizione di indipendenza dei parametri poiché non sono variabili casuali; alcuni concetti correlati potrebbero essere identificabilità , ortogonalità dei parametri e indipendenza degli stimatori di massima verosimiglianza (che sono variabili casuali).

Qualche esempio,

(1). Caso discreto . è un campione di (indipendente) osservazioni discrete con P ( osservando  x j ; θ ) > 0 , allorax=(x1,...,xn)P(observing xj;θ)>0

L(θ;x)j=1nP(observing xj;θ).

In particolare, se , con N noto, lo abbiamoxjBinomial(N,θ)N

L(θ;x)j=1nθxj(1θ)Nxj.

(2). Approssimazione continua . Let sia un campione da una vc continua X , con la distribuzione F e la densità f , con la misura di errore ε , questo è, si osservano i gruppi ( x jx=(x1,...,xn)XFfϵ . Poi(xjϵ,xj+ϵ)

L(θ;x)j=1nP[observing (xjϵ,xj+ϵ);θ]=j=1n[F(xj+ϵ;θ)F(xjϵ;θ)]

Quando è piccolo, questo può essere approssimato (usando il Teorema del valore medio) diϵ

L(θ;x)j=1nf(xj;θ)

Per un esempio con il caso normale, dai un'occhiata a questo .

(3). Modello dipendente e Markov . Si supponga che è un insieme di osservazioni eventualmente dipendenti e lasciare che f sia la densità congiunta di x , allorax=(x1,...,xn)fx

L(θ;x)f(x;θ).

Se inoltre la proprietà Markov è soddisfatta, allora

L(θ;x)f(x;θ)=f(x1;θ)j=1n1f(xj+1|xj;θ).

Dai un'occhiata anche a questo .


3
Dal momento in cui scrivi la funzione di probabilità come prodotto, stai implicitamente assumendo una struttura di dipendenza tra le osservazioni. Quindi per l'MLE sono necessarie due ipotesi (a) una sulla distribuzione di ogni singolo risultato e (b) una sulla dipendenza tra i risultati.

10

(+1) Ottima domanda.

Cosa minore, MLE significa massimo stima della verosimiglianza (non multipla), il che significa che è sufficiente massimizzare la verosimiglianza. Ciò non specifica che la probabilità deve essere prodotta dal campionamento IID.

Se la dipendenza del campionamento può essere scritta nel modello statistico, basta scrivere la probabilità di conseguenza e massimizzarla come al solito.

L'unico caso degno di nota quando non si assume la dipendenza è quello del campionamento gaussiano multivariato (ad esempio nell'analisi delle serie storiche). La dipendenza tra due variabili gaussiane può essere modellata dal loro termine di covarianza, che incorpori nella probabilità.

Per fare un esempio semplicistico, supponi di disegnare un campione di dimensione 2 da variabili gaussiane correlate con la stessa media e varianza. Scriveresti la probabilità come

12πσ21ρ2exp(z2σ2(1ρ2)),

dove z è

z=(x1μ)22ρ(x1μ)(x2μ)+(x2μ)2.

(μ,σ,ρ)


2
Queste sono buone risposte ed esempi. L'unica cosa che aggiungerei per vederlo in termini semplici è che la stima della probabilità richiede solo che un modello per la generazione dei dati sia specificato in termini di alcuni parametri sconosciuti da descrivere in forma funzionale.
Michael R. Chernick,

(+1) Assolutamente vero! Hai un esempio di modello che non può essere specificato in quei termini?
gui11aume,

@ gu11aume Penso che ti riferisca alla mia osservazione. Direi che non stavo dando una risposta diretta alla domanda. La risposta alla domanda è sì perché ci sono esempi che possono essere mostrati in cui la funzione di probabilità può essere espressa quando i dati sono generati da variabili casuali dipendenti.
Michael R. Chernick,

2
Esempi in cui ciò non può essere fatto sarebbero i dati forniti senza alcuna descrizione del meccanismo di generazione dei dati o il modello non viene presentato in una forma parametrica, ad esempio quando vengono forniti due set di dati iid e viene chiesto di verificare se provengono da la stessa distribuzione in cui si specifica solo che le distribuzioni sono assolutamente continue.
Michael R. Chernick,

4

Naturalmente, i modelli ARMA gaussiani hanno una probabilità, poiché la loro funzione di covarianza può essere derivata esplicitamente. Questa è sostanzialmente un'estensione della risposta di gui11ame a più di 2 osservazioni. Il googling minimo produce articoli come questo in cui la probabilità è data in forma generale.

Un altro, in una certa misura, più intrigante, classe di esempi è data da modelli di effetti casuali multilivello . Se si dispone di dati del modulo

yioj=Xioj'β+uio+εioj,
dove indici j sono nidificati in io (pensa agli studenti j nelle aule io, diciamo, per un'applicazione classica di modelli multilivello), quindi, supponendo εiojuio, la probabilità è
lnL~ΣiolnΠjf(yioj|β,uio)dF(uio)
and is a sum over the likelihood contributions defined at the level of clusters, not individual observations. (Of course, in the Gaussian case, you can push the integrals around to produce an analytic ANOVA-like solution. However, if you have say a logit model for your response yij, then there is no way out of numerical integration.)

2
Stask and @gui11aume, these three answers are nice but I think they miss a point: what about the consistency of the MLE for dependent data ?
Stéphane Laurent
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.