Quali sono alcune applicazioni illustrative della probabilità empirica?


28

Ho sentito parlare della probabilità empirica di Owen, ma fino a poco tempo fa non ho prestato attenzione fino a quando non l'ho incontrato in un documento di interesse ( Mengersen et al. 2012 ).

Nei miei sforzi per capirlo, ho raccolto che la probabilità dei dati osservati è rappresentata come , dove e .

L=ipi=iP(Xi=x)=iP(Xix)P(Xi<x)
ipi=1pi>0

Tuttavia, non sono stato in grado di fare il salto mentale collegando questa rappresentazione con come può essere usata per fare inferenze sulle osservazioni. Forse sono troppo radicato nel pensare a una probabilità rispetto ai parametri di un modello?

Indipendentemente da ciò, ho cercato su Google Scholar un documento che impiegava una probabilità empirica che mi avrebbe aiutato a interiorizzare il concetto ... senza risultato. Ovviamente, c'è il libro di Art Owen su Empirical Likelihood , ma Google Books lascia fuori tutte le cose squisite e sono ancora in procinto di ottenere un prestito interbibliotecario.

Nel frattempo, qualcuno può gentilmente indicarmi documenti e documenti che illustrano chiaramente la premessa della probabilità empirica e come viene impiegata? Sarebbe anche gradita una descrizione illustrativa della stessa EL!


2
Gli econometrici, in particolare, si sono innamorati di EL. Se stai cercando applicazioni , quella letteratura potrebbe essere uno dei posti migliori in cui cercare.
cardinale il

Risposte:


17

Non riesco a pensare a un posto migliore del libro di Owen per conoscere la probabilità empirica.

Un modo pratico di pensare a è come la probabilità di una distribuzione multinomiale sui punti dati osservati . La probabilità è quindi una funzione del vettore di probabilità , lo spazio dei parametri è in realtà il simplex dimensionale dei vettori di probabilità e il MLE sta mettendo il peso su ciascuna delle osservazioni (supponendo che siano sono tutti diversi). La dimensione dello spazio dei parametri aumenta con il numero di osservazioni.x 1 , , x n ( p 1 , , p n ) n 1 / nL=L(p1,,pn)x1,,xn(p1,,pn)n1/n

Un punto centrale è che la probabilità empirica fornisce un metodo per calcolare gli intervalli di confidenza profilando senza specificare un modello parametrico. Se il parametro di interesse è la media, , allora per qualsiasi vettore di probabilità abbiamo che la media è e siamo in grado di calcolare la probabilità profilo come Quindi possiamo calcolare gli intervalli di confidenza del modulo con . Qui è la media empirica ep = ( p 1 , , p n ) μ ( p ) = n i = 1 x i p i , L prof ( μ ) = max { L ( p ) μ ( p ) = μ } .μp=(p1,,pn)

μ(p)=i=1nxipi,
Lprof(μ)=max{L(p)μ(p)=μ}.
r ( 0 , 1 ) ˉ x L prof ( ˉ x ) = n - n I r r I r r
Ir={μLprof(μ)rLprof(x¯)}
r(0,1)x¯Lprof(x¯)=nn. Gli intervalli dovrebbero forse essere semplicemente chiamati (profilo) intervalli di probabilità poiché nessuna dichiarazione sulla copertura viene fatta in anticipo. Diminuendo gli intervalli (sì, sono intervalli) formano una famiglia di intervalli di confidenza nidificata e crescente. La teoria asintotica o il bootstrap possono essere usati per calibrare per ottenere una copertura del 95%, diciamo.IrrIrr

Il libro di Owen tratta questo in dettaglio e fornisce estensioni a problemi statistici più complicati e altri parametri di interesse.


4
(+1) In mancanza di accesso al libro, si può sempre iniziare con gli articoli originali per ottenere le basi della teoria. Come il libro, anche i giornali sono scritti in modo abbastanza chiaro.
cardinale il

6
Alcuni collegamenti: ( 1 ) A. Owen (1988), Intervalli di confidenza del rapporto di probabilità empirica per un singolo funzionale , Biometrika , vol. 75, n. 2, pagg. 237-249, ( 2 ) A. Owen (1990), regioni di confidenza del rapporto di verosimiglianza empirica , ann. Statist. , vol. 18, n. 1, pagg. 90-120 ( accesso aperto ) e ( 3 ) A. Owen (1991) Probabilità empirica per i modelli lineari , Ann. Statist. , vol. 19, n. 4, pagg. 1725-1747 ( accesso aperto ).
cardinale il

@cardinal Fantastic! Avrei dovuto pensarci io stesso.
Sameer,

@NHS Grazie per la tua spiegazione! Giusto per essere chiari, l' le ? Inoltre, puoi spiegare perché ? Dovrebbe forse essere ? Lprof(μ)argmaxpLprof(x¯)=nnin1=nn
Sameer,

@Sameer, l'errore di battitura ora è corretto. Tuttavia, è non è l'argmax. È la probabilità del profilo ottenuta massimizzando la probabilità su tutti i vettori di parametri con un dato valore di . A proposito, con un adeguato accesso universitario, ho ottenuto una versione elettronica dal CRC dei singoli capitoli del libro di Owen. μ
NRH,

15

In econometria, molti documenti applicati iniziano con l'ipotesi che dove è un vettore di dati, è un sistema noto di equazioni e è un parametro sconosciuto, . La funzione deriva da un modello economico. L'obiettivo è stimare .

E[g(X,θ)]=0
XgqθΘRpqpθgθ

L'approccio tradizionale, in econometria, per la stima e l'inferenza su consiste nell'utilizzare un metodo di momenti generalizzato: dove è una matrice di ponderazione definita positiva e La probabilità empirica fornisce uno stimatore alternativo a GMM. L'idea è di imporre la condizione del momento come vincolo quando si massimizza la probabilità non parametrica. Innanzitutto, correggi un . Quindi risolvere soggetto a θ GMM = argmin θ Θθ

θ^GMM=argminθΘg¯n(θ)Wg¯n(θ)
W
g¯n(θ):=1ni=1ng(Xi,θ).
θ
L(θ)=maxp1,,pni=1npi
i=1npi=1,pi0,i=1npig(Xi,θ)=0.
Questo è il ciclo interno '. Quindi massimizza su : Questo approccio ha dimostrato di avere proprietà di ordine superiore rispetto a GMM (vedi Newey and Smith 2004, Econometrica ), motivo per cui è preferibile GMM. Per ulteriori riferimenti, vedere le note e la conferenza di Imbens e Wooldridge qui (lezione 15).θ
θ^EL=argmaxθΘlogL(θ).

Ci sono ovviamente molte altre ragioni per cui EL ha attirato l'attenzione in econometria, ma spero che questo sia un utile punto di partenza. I modelli di uguaglianza dei momenti sono molto comuni nell'economia empirica.


Grazie per aver scritto una risposta così chiara e ben referenziata. Benvenuto nella nostra comunità!
whuber

7

Nell'analisi di sopravvivenza, la curva di Kaplan-Meier è il più famoso stimatore non parametrico della funzione di sopravvivenza , dove indica la variabile casuale tempo-evento. Fondamentalmente, è una generalizzazione della funzione di distribuzione empirica che consente la censura. Può essere derivato euristicamente, come indicato nella maggior parte dei libri di testo pratici. Ma può anche essere formalmente derivato come uno stimatore di probabilità massimo (empirico). Ecco maggiori dettagli .T SS(t)=Pr(T>t)TS^

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.