MLE per la distribuzione triangolare?


12

È possibile applicare la normale procedura MLE alla distribuzione triangolare? - Ci sto provando ma mi sembra di essere bloccato in un passo o nell'altro in matematica dal modo in cui è definita la distribuzione. Sto cercando di usare il fatto che conosco il numero di campioni sopra e sotto c (senza conoscere c): questi 2 numeri sono cn e (1-c) n, se n è il numero totale di campioni. Tuttavia, ciò non sembra aiutare nella derivazione. Il momento dei momenti fornisce uno stimatore per c senza molti problemi. Qual è la natura esatta dell'ostruzione a MLE qui (se effettivamente ce n'è uno)?

Più dettagli:

Consideriamo in [ 0 , 1 ] e la distribuzione definita su [ 0 , 1 ] da: c[0,1][0,1]

f(X;c)=2Xc se x <c
f(X;c)=2(1-X)(1-c) se c <= x

Facciamo un n iid campioni {Xio} da questa distribuzione modulo il log-verosimiglianza di c dato questo esempio:

l^(c|{Xio})=Σio=1nln(f(Xio|c))

Sto quindi cercando di usare il fatto che, data la forma di , sappiamo che i campioni di scenderanno al di sotto della (sconosciuta) , e cadranno al di sopra di . IMHO, questo consente di scomporre la somma nell'espressione della probabilità logaritmica in questo modo:c n c ( 1 - c ) n cfcnc(1-c)nc

l^(c|{xi})=i=1cnln2xic+i=1(1c)nln2(1xi)1c

Qui, non sono sicuro di come procedere. MLE comporterà prendendo un derivato wrt della verosimiglianza, ma ho come limite superiore della sommatoria, che sembra bloccare tale. Potrei provare con un'altra forma di verosimiglianza, usando le funzioni dell'indicatore:ccc

l^(c|{xi})=i=1n{xi<c}ln2xic+i=1n{c<=xi}ln2(1xi)1c

Ma anche derivare gli indicatori non sembra facile, anche se i delta di Dirac potrebbero consentire di continuare (pur avendo ancora degli indicatori, dato che dobbiamo derivare i prodotti).

Quindi, qui sono bloccato in MLE. Qualche idea?


Se questo è per qualche argomento, si prega di aggiungere il tag di autoapprendimento. In caso contrario, spiegare come si presenta il problema.
Glen_b

Grazie per l'aggiornamento; rende molto più facile dire cose sensate in risposta, poiché riduce notevolmente la portata dei casi da affrontare. Potresti per favore considerare il mio commento precedente. O questo rientra nel tag di autoapprendimento o no, in entrambi i casi ho chiesto se avresti fatto qualcosa.
Glen_b

Questo non per i compiti o una lezione. Sorge al mio lavoro. Abbiamo un altro stimatore dal metodo dei momenti, ma sto cercando di capire meglio cosa sta succedendo con MLE qui.
Frank,

Va bene; questo mi dà più margine di manovra. Vedi la mia risposta aggiornata. Probabilmente farò presto ulteriori aggiunte
Glen_b -Restate Monica

Aggiunti riferimenti / collegamenti
Glen_b -Reinstate Monica

Risposte:


10

È possibile applicare la normale procedura MLE alla distribuzione triangolare?

Certamente! Sebbene ci siano alcune stranezze da affrontare, in questo caso è possibile calcolare gli MLE.

Tuttavia, se per "la solita procedura" intendi "prendi i derivati ​​della verosimiglianza e impostala uguale a zero", allora forse no.

Qual è la natura esatta dell'ostruzione a MLE qui (se effettivamente ce n'è uno)?

Hai provato a disegnare la probabilità?

-

Seguito dopo il chiarimento della domanda:

La domanda sul disegno della probabilità non era un commento inattivo, ma centrale nella questione.

L'MLE prevede l'assunzione di un derivato

No. MLE comporta la ricerca dell'argmax di una funzione. Ciò comporta solo la ricerca degli zeri di un derivato in determinate condizioni ... che non valgono qui. Nel migliore dei casi, se riesci a farlo, identificherai alcuni minimi locali .

Come suggerito dalla mia domanda precedente, guarda la probabilità.

y

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

cprobabilità di picco di triangolare

probabilità logaritmica per il picco triangolare

Le linee grigie segnano i valori dei dati (probabilmente avrei dovuto generare un nuovo campione per ottenere una migliore separazione dei valori). I punti neri indicano la probabilità / probabilità logaritmica di tali valori.

Ecco uno zoom vicino al massimo della probabilità, per vedere più dettagli:

Particolare della probabilità

Come si può vedere dalla probabilità, in molte statistiche dell'ordine, la funzione di probabilità ha "angoli" acuti - punti in cui la derivata non esiste (il che non sorprende - il pdf originale ha un angolo e stiamo prendendo un prodotto di pdf). Questo (che ci sono cuspidi nelle statistiche dell'ordine) è il caso della distribuzione triangolare e il massimo si verifica sempre in una delle statistiche dell'ordine. (Che le cuspidi si verificano alle statistiche degli ordini non è univoco per le distribuzioni triangolari; ad esempio la densità di Laplace ha un angolo e di conseguenza la probabilità per il suo centro ne ha una per ogni statistica degli ordini.)

Come accade nel mio campione, il massimo si verifica come statistica del quarto ordine, 0,3780912

cc

Un utile riferimento è il capitolo 1 di " Beyond Beta " di Johan van Dorp e Samuel Kotz. Come capita, il capitolo 1 è un capitolo 'campione' gratuito per il libro: puoi scaricarlo qui .

C'è un delizioso piccolo articolo di Eddie Oliver su questo problema con la distribuzione triangolare, penso in American Statistician (il che rende sostanzialmente gli stessi punti; penso che fosse in un angolo degli insegnanti). Se riesco a trovarlo, lo darò come riferimento.

Modifica: eccolo:

EH Oliver (1972), A Maximum Likelihood Oddity,
The American Statistician , Vol 26, Issue 3, June, p43-44

( link del publisher )

Se riesci a prenderlo facilmente, vale la pena dare un'occhiata, ma quel capitolo di Dorp e Kotz copre la maggior parte delle questioni rilevanti, quindi non è cruciale.


A titolo di follow-up sulla domanda nei commenti, anche se potessi trovare un modo per 'appianare' gli angoli, dovresti comunque affrontare il fatto che puoi ottenere più massimi locali:

due locali max

Tuttavia, potrebbe essere possibile trovare stimatori con proprietà molto buone (meglio del metodo dei momenti), che è possibile scrivere facilmente. Ma ML su triangolare su (0,1) è alcune righe di codice.

Se si tratta di enormi quantità di dati, anche questo può essere affrontato, ma sarebbe un'altra domanda, penso. Ad esempio, non tutti i punti dati possono essere massimi, il che riduce il lavoro e ci sono altri risparmi che possono essere fatti.


Grazie - Proverò a pubblicare il mio tentativo fallito, mostrando quale distribuzione sto esattamente parlando e dove penso di essere bloccato.
Frank,

Grazie per la spiegazione dettagliata! Ho avuto un'altra idea però: supponiamo che potrei trovare una famiglia di funzioni che converge alla distribuzione triangolare, ma non sarebbe a tratti - potrei usarlo per derivare analiticamente un MLE, quindi prendere il limite e supporre che avrei un MLE del distribuzione triangolare stessa?
Frank,

Forse - penso che potrebbe dipendere dal particolare processo limite che usi ... e probabilmente finirai comunque con diversi massimi locali, quindi probabilmente ti farà risparmiare solo la valutazione della probabilità vicino alle statistiche dell'ordine estremo - ma anche se ha funzionato, perché dovresti provare a fare qualcosa di così complicato? Cosa c'è di sbagliato con ML sulla distribuzione triangolare? È davvero abbastanza semplice da fare in pratica.
Glen_b

2
Devo dire che questo MLE per c basato sulle statistiche degli ordini è piuttosto carino, anche se la derivazione nel capitolo sopra richiede un po 'di lavoro (non troppo difficile) - bella illustrazione che l'essenza di MLE è nell'argmax (ovviamente!), piuttosto che il derivato (come hai sottolineato, e sono pienamente d'accordo, mi è venuto in mente di lavorare a monte del "solito" passaggio derivato (cioè preoccuparmi solo di massimizzare, con qualsiasi mezzo), ma non ho perseguito).
Frank,

1
Xio
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.