Le interpretazioni bayesiane esistono solo nell'ambito dell'analisi bayesiana, per gli stimatori che si riferiscono a una distribuzione posteriore. Quindi, l'unico modo in cui allo stimatore REML potrebbe essere data un'interpretazione bayesiana (cioè un'interpretazione come stimatore presa dal posteriore) è se consideriamo la probabilità logaritmica limitata nell'analisi REML di essere il log-posteriore in un corrispondente Analisi di Bayes; in questo caso lo stimatore REML sarebbe uno stimatore MAP dalla teoria bayesiana, con la sua corrispondente interpretazione bayesiana.
Impostare lo stimatore REML come uno stimatore MAP: è relativamente semplice vedere come impostare la probabilità logaritmica limitata nell'analisi REML come log-posteriore in un'analisi Bayes. Per fare ciò, richiediamo che il log-before sia negativo della parte della verosimiglianza che viene rimossa dal processo REML. Supponiamo di avere verosimiglianza log dove è la probabilità logaritmica residua e è il parametro di interesse (con come parametro di disturbo). L'impostazione del precedente a dà il posteriore corrispondente:ℓ RE ( θ ) θ ν π ( θ , ν ) ∝ exp ( - ℓ ∗ ( θ , ν ) )ℓx(θ,ν)=ℓ∗(θ,ν)+ℓRE(θ)ℓRE(θ)θνπ(θ,ν)∝exp(−ℓ∗(θ,ν))
π(θ|x)∝∫Lx(θ,ν)π(θ,ν)dν∝∫exp(ℓx(θ,ν))exp(−ℓ∗(θ,ν))dν=∫exp(ℓx(θ,ν)−ℓ∗(θ,ν))dν=∫exp(ℓ∗(θ,ν)+ℓRE(θ)−ℓ∗(θ,ν))dν=∫exp(ℓRE(θ))dν=∫LRE(θ)dν∝LRE(θ).
Questo ci dà:
θ^MAP=argmaxθπ(θ|x)=argmaxθLRE(θ)=θ^REML.
Questo risultato ci consente di interpretare lo stimatore REML come uno stimatore MAP, quindi la corretta interpretazione bayesiana dello stimatore REML è che è lo stimatore che massimizza la densità posteriore rispetto al precedente .
Avendo illustrato il metodo per fornire un'interpretazione bayesiana allo stimatore REML, notiamo ora che ci sono alcuni grossi problemi con questo approccio. Un problema è che il precedente viene formato utilizzando il componente di verosimiglianza log , che dipende dai dati. Quindi, il "priore" necessario per ottenere questa interpretazione non è un vero priore, nel senso di essere una funzione che può essere formata prima di vedere i dati. Un altro problema è che il precedente sarà spesso improprio (cioè non si integra con uno) e potrebbe effettivamente aumentare di peso quando i valori dei parametri diventano estremi. (Mostreremo un esempio di questo di seguito.)ℓ∗(θ,ν)
Sulla base di questi problemi, si potrebbe sostenere che non esiste un'interpretazione bayesiana ragionevole per lo stimatore REML. In alternativa, si potrebbe sostenere che lo stimatore REML mantiene ancora la suddetta interpretazione bayesiana, essendo uno stimatore massimo a posteriori in un "precedente" che deve coincidere casualmente con i dati osservati nella forma specificata e può essere estremamente improprio.
Illustrazione con dati normali: il classico esempio di stima REML si riferisce al caso di dati normali cui sei interessato alla precisione e la media è un parametro fastidioso. In questo caso hai la funzione di verosimiglianza:x1,...,xn∼N(ν,1/θ)θν
ℓx(ν,θ)=−n2lnθ−θ2∑i=1n(xi−ν)2.
In REML abbiamo diviso questa verosimiglianza nei due componenti:
ℓ∗(ν,θ)ℓRE(θ)=−n2lnθ−θ2∑i=1n(xi−ν)2=−n−12lnθ−θ2∑i=1n(xi−x¯)2.
Otteniamo lo stimatore REML per il parametro di precisione massimizzando la probabilità residua, che fornisce uno stimatore imparziale per la varianza:
1θ^REML=1n−1∑i=1n(xi−x¯)2.
In questo caso, lo stimatore REML corrisponderà a uno stimatore MAP per la densità "precedente":
π(θ)∝θn/2exp(θ2∑i=1n(xi−ν)2).
Come puoi vedere, questo "precedente" in realtà dipende dai valori dei dati osservati, quindi non può essere effettivamente formato prima di vedere i dati. Inoltre, possiamo vedere che è chiaramente un precedente "improprio" che mette sempre più peso sui valori estremi di e . (In realtà, questo precedente è piuttosto disgustoso.) Se per "coincidenza" dovessi formare un precedente che corrispondesse a questo risultato, lo stimatore REML sarebbe uno stimatore MAP sotto quello precedente, e quindi avrebbe un'interpretazione bayesiana come stimatore che massimizza il posteriore sotto quello precedente.θν