Come adattare un PDF approssimativo (ovvero: stima della densità) usando i primi k (empirici) momenti?


11

Ho una situazione in cui sono in grado di stimare (i primi) momenti di un set di dati e vorrei utilizzarlo per produrre una stima della funzione di densità.k

Mi sono già imbattuto nella distribuzione di Pearson , ma mi sono reso conto che si basa solo sui primi 4 momenti (con alcune restrizioni sulle possibili combinazioni di momenti).

Capisco anche che qualsiasi serie di momenti finiti non è sufficiente per "fissare" una distribuzione specifica, quando non si usano più ipotesi. Tuttavia, vorrei ancora per una classe di distribuzioni più generale (diversa dalla famiglia di distribuzioni Pearson). Guardando altre domande, non sono riuscito a trovare una tale distribuzione (vedi: qui , qui , qui , qui , qui e qui ).

Esiste una famiglia di distribuzione generalizzata ("semplice") che può essere definita per qualsiasi set di momenti? (forse un insieme di trasformazioni che può assumere una distribuzione normale standard e la trasforma fino a quando non si conferma con tutto l'insieme di k momenti)kk

(Non mi interessa molto se assumiamo che gli altri momenti siano 0 o no)k+1

Grazie.

ps: sarei felice per un esempio esteso. Preferibilmente con un esempio di codice R.


2
kkE[Xk]=(i)kϕX(k)(0)k

Grazie @StephanKolassa - c'è qualche possibilità per una risposta estesa / un esempio di codice R?
Tal Galili,


Caro @whuber, potresti per favore suggerire un esempio di codice R? (anche, questo corrisponde alla risposta dei lupi?)
Tal Galili,

Questo è un approccio completamente diverso da quella risposta.
whuber

Risposte:


11

Metodo 1: sistemi Pearson di ordine superiore

p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

(a,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

che produce la soluzione:

inserisci qui la descrizione dell'immagine

Ho risolto questo problema per un po 'di tempo fa (avendo lo stesso treno di pensiero dell'OP): la derivazione e la soluzione sono riportate nel capitolo 5 del nostro libro; se interessati, un download gratuito è disponibile qui:

http://www.mathstatica.com/book/bookcontents.html

Si noti che mentre la famiglia Pearson di secondo ordine (quadratica) può essere espressa in termini di primi 4 momenti, la famiglia di tipo Pearson di terzo ordine (cubica) richiede i primi 6 momenti.

Metodo 2: espansioni Gram-Charlier

kth

Momenti della popolazione o momenti di esempio ??

Per il sistema in stile Pearson: se i momenti della popolazione sono noti, l'uso di momenti più elevati dovrebbe produrre in modo inequivocabile un adattamento migliore. Se, tuttavia, i dati osservati sono un campione casuale prelevato dalla popolazione, esiste un compromesso: un polinomio di ordine superiore implica che sono necessari momenti di ordine superiore e le stime di quest'ultimo possono essere inaffidabili (hanno una varianza elevata), a meno che la dimensione del campione non sia "grande". In altre parole, dati i dati di esempio, adattarsi usando momenti più alti può diventare "instabile" e produrre risultati inferiori. Lo stesso vale per le espansioni di Gram-Charlier: l'aggiunta di un termine aggiuntivo può effettivamente comportare risultati peggiori, quindi è necessaria una certa cura.


Cari @wolfies, grazie per la vostra risposta! Se ti capisco correttamente, le espansioni di Gram-Charlier sono più in linea con ciò che sto cercando (anche se la distribuzione Pearson più generalizzata è interessante da sapere). Ho guardato il tuo libro (capitolo 5, a partire da pagina 175) e ti ho visto dare una descrizione dettagliata (con anche menzioni su come affrontare i momenti stimati, che è il mio caso). L'unica cosa è che non posso usare il tuo codice (dal momento che sono un utente R). Grazie per la tua risposta (e anche per il tuo libro che sembra impressionante e interessante in generale)
Tal Galili,

2
Ho appena trovato un pacchetto R per gestire i vari metodi: cran.us.r-project.org/web/packages/PDQutils/vignettes/…
Tal Galili,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.