Ho appena pensato a un modo pulito (non necessariamente buono) per creare stime di densità monodimensionali e la mia domanda è:
Questo metodo di stima della densità ha un nome? In caso contrario, è un caso speciale di qualche altro metodo in letteratura?
Ecco il metodo: Abbiamo un vettore che presumiamo sia tratto da una distribuzione sconosciuta che vorremmo stimare. Un modo per farlo è quello di prendere tutte le possibili coppie di valori in X e per ogni coppia [ x i , x j ] i ≠ j adattare una distribuzione normale usando la massima verosimiglianza. La stima della densità risultante è quindi la distribuzione della miscela che consiste in tutte le Normali risultanti, in cui a ciascuna Normale viene assegnato lo stesso peso.
La figura seguente illustra l'utilizzo di questo metodo sul vettore . Qui i cerchi sono i punti di riferimento dei dati, le normali colorate sono le distribuzioni di massima verosimiglianza stimate usando ogni coppia possibile e la linea nera spessa mostra la stima della densità risultante (cioè la distribuzione della miscela).
A proposito, è davvero facile implementare un metodo in R che preleva un campione dalla distribuzione della miscela risultante:
# Generating some "data"
x <- rnorm(30)
# Drawing from the density estimate using the method described above.
density_estimate_sample <- replicate(9999, {
pair <- sample(x, size = 2)
rnorm(1, mean(pair), sd(pair))
})
# Plotting the density estimate compared with
# the "data" and the "true" density.
hist(x ,xlim=c(-5, 5), main='The "data"')
hist(density_estimate_sample, xlim=c(-5, 5), main='Estimated density')
hist(rnorm(9999), xlim=c(-5, 5), main='The "true" density')
x <- c(rnorm(30), rnorm(30, 10))