Se il tuo interesse principale è rappresentato dai problemi bidimensionali, direi che la stima della densità del kernel è una buona scelta perché ha delle belle proprietà asintotiche (nota che non sto dicendo che sia il migliore). Vedi per esempio
Parzen, E. (1962). Sulla stima di una funzione e modalità di densità di probabilità . Annali delle statistiche matematiche 33: 1065–1076.
de Valpine, P. (2004). Probabilità di spazio nello stato di Monte Carlo mediante stima ponderata della densità del kernel posteriore . Diario dell'American Statistical Association 99: 523-536.
Per dimensioni superiori (4+) questo metodo è molto lento a causa della ben nota difficoltà nella stima della matrice di larghezza di banda ottimale, vedere .
Ora, il problema con il comando ks
nel pacchetto KDE
è, come hai detto, che valuta la densità in una griglia specifica che può essere molto limitante. Questo problema può essere risolto se si utilizza il pacchetto KDE
per stimare la matrice della larghezza di banda, utilizzando ad esempio lo Hscv
strumento per stimare la densità del kernel e quindi ottimizzare questa funzione mediante il comando optim
. Questo è mostrato sotto usando dati simulati e un kernel gaussiano in R
.
rm(list=ls())
# Required packages
library(mvtnorm)
library(ks)
# simulated data
set.seed(1)
dat = rmvnorm(1000,c(0,0),diag(2))
# Bandwidth matrix
H.scv=Hlscv(dat)
# [Implementation of the KDE](http://en.wikipedia.org/wiki/Kernel_density_estimation)
H.eig = eigen(H.scv)
H.sqrt = H.eig$vectors %*% diag(sqrt(H.eig$values)) %*% solve(H.eig$vectors)
H = solve(H.sqrt)
dH = det(H.scv)
Gkde = function(par){
return( -log(mean(dmvnorm(t(H%*%t(par-dat)),rep(0,2),diag(2),log=FALSE)/sqrt(dH))))
}
# Optimisation
Max = optim(c(0,0),Gkde)$par
Max
Gli stimatori con forma limitata tendono ad essere più veloci, per esempio
Cule, ML, Samworth, RJ e Stewart, MI (2010). Stima della massima verosimiglianza di una densità multidimensionale concavo-log . Journal Royal Statistical Society B 72: 545–600.
Ma sono troppo alti per questo scopo.
4
Altri metodi che potresti considerare di utilizzare sono: adattamento di una miscela finita multivariata di normali (o altre distribuzioni flessibili) o
Abraham, C., Biau, G. e Cadre, B. (2003). Stima semplice della modalità di una densità multivariata . The Canadian Journal of Statistics 31: 23–34.
Spero che questo possa essere d'aiuto.