Stima della densità del kernel su distribuzioni asimmetriche


10

Sia osservazioni tratte da una distribuzione di probabilità sconosciuta (ma sicuramente asimmetrica).{x1,,xN}

Vorrei trovare la distribuzione di probabilità usando l'approccio KDE: Comunque, ho provato ad usare un kernel gaussiano, ma ha funzionato male, dato che è simmetrico. Quindi, ho visto che alcuni lavori sui kernel Gamma e Beta sono stati rilasciati, anche se non ho capito come operare con essi.

f^(x)=1Nhi=1NK(xxih)

La mia domanda è: come gestire questo caso asimmetrico, supponendo che il supporto della distribuzione sottostante non sia nell'intervallo ?[0,1]


4
Nel caso di densità vicine al lognormale (che riscontro molto in alcune applicazioni particolari), trasformo semplicemente (prendendo i registri) e poi eseguo KDE, quindi trasformo nuovamente KDE (è necessario ricordare il giacobino durante la trasformazione il preventivo indietro). Funziona abbastanza bene in quel caso.
Glen_b -Restate Monica

@Glen_b hai qualche riferimento o materiale in cui è descritto questo metodo? (Calcolo del KDE su una trasformazione della variabile originale e poi trasformazione del KDE indietro)
boscovich

Non che io sappia: sono sicuro che esistono, poiché è un'idea piuttosto banale e facilmente implementabile. È il genere di cose che mi aspetterei da una laurea in grado di derivare. In pratica funziona molto bene.
Glen_b

@glen_b grazie. Quindi se dovessi usarlo in un rapporto tecnico / pubblicazione pensi che sarebbe giusto non dare alcun riferimento?
boscovich,

1
@guy È certamente possibile avere problemi, soprattutto con alcune trasformazioni e alcuni tipi di dati. Le situazioni che ho usato tendono ad essere abbastanza vicine al lognormale, e lì il cambiamento nella larghezza di banda che vedi come un problema è esattamente ciò che è necessario; fa molto meglio di KDE sui dati grezzi. Dalla descrizione del PO sembrava abbastanza simile, ma non è come se stessi suggerendo che fosse una panacea .
Glen_b

Risposte:


5

Prima di tutto, KDE con kernel simmetrici può anche funzionare molto bene quando i tuoi dati sono asimmetrici. Altrimenti, in pratica sarebbe completamente inutile.

In secondo luogo, hai considerato di riscalare i tuoi dati per correggere l'asimmetria, se ritieni che ciò stia causando il problema. Ad esempio, potrebbe essere una buona idea provare ad andare su , poiché è noto per aiutare in molti problemi.log(x)


Se riscali a log(x), devi anche rendere conto di un jacobian?
DilithiumMatrix,

0

Hmm. Potresti volere una larghezza del kernel che cambia in funzione della posizione.

Se stessi esaminando il problema in eCDF, allora potrei provare a fare in modo che una pendenza numerica del CDF sia correlata alla dimensione del kernel.

Penso che se hai intenzione di fare una trasformazione delle coordinate, devi avere una buona idea dei punti di inizio e fine. Se conosci così bene la distribuzione di destinazione, non hai bisogno dell'approssimazione del kernel.


1
Potrei facilmente sapere che i miei camper non sono negativi ma vogliono comunque un KDE.
ragazzo,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.