Sto facendo una stima della densità del kernel, con un set di punti ponderati (cioè, ogni campione ha un peso che non è necessario), in N dimensioni. Inoltre, questi campioni sono solo in uno spazio metrico (cioè, possiamo definire una distanza tra loro) ma nient'altro. Ad esempio, non possiamo determinare la media dei punti di campionamento, né la deviazione standard, né ridimensionare una variabile rispetto ad un'altra. Il kernel è solo influenzato da questa distanza e dal peso di ciascun campione:
In questo contesto, sto cercando di trovare una stima robusta per la larghezza di banda del kernel , possibilmente variabile spazialmente, e preferibilmente che dia una ricostruzione esatta sul set di dati di addestramento . Se necessario, potremmo supporre che la funzione sia relativamente regolare.
Ho provato a usare la distanza dal primo o dal secondo vicino più vicino, ma dà risultati piuttosto negativi. Ho provato con l'ottimizzazione "one-out-out", ma ho difficoltà a trovare una buona misura per l'ottimizzazione in questo contesto in Nd, quindi trova stime pessime, specialmente per i campioni di training stessi. Non posso usare la stima avida basata sul presupposto normale poiché non posso calcolare la deviazione standard. Ho trovato riferimenti usando matrici di covarianza per ottenere kernel anisotropi, ma ancora una volta, non si sarebbe tenuto in questo spazio ...
Qualcuno ha un'idea o un riferimento?