Se il kernel di Epanechnikov è teoricamente ottimale quando si esegue la stima della densità del kernel, perché non è più comunemente usato?


18

Ho letto (per esempio, qui ) che il kernel Epanechnikov è ottimale, almeno in senso teorico, quando si esegue la stima della densità del kernel. Se questo è vero, allora perché il gaussiano si presenta così frequentemente come il kernel predefinito, o in molti casi l'unico kernel, nelle librerie di stima della densità?


2
Qui si sono poste due domande: perché non più utilizzate? perché Gaussian è spesso il kernel predefinito / unico? Può sembrare banale, ma il nome Epanechnikov può sembrare difficile da pronunciare e pronunciare correttamente per le persone che non parlano fluentemente quella lingua. (Non sono nemmeno sicuro che E. fosse russo; non sono riuscito a trovare alcun dettaglio biografico.) Inoltre, se mostro (ad esempio) un bi-peso, commenta la sua forma a campana, la larghezza finita e il comportamento ai bordi, che sembrano più facile da vendere. Epanechnikov è l'impostazione predefinita in Stata's kdensity.
Nick Cox,

3
Aggiungo che questa ottimalità teorica ha poca rilevanza nella pratica, se presente.
Xi'an,

2
È un nome familiare. Se ha senso usare un kernel che non ha un supporto finito, dovresti preferirlo. Per quanto riguarda la mia esperienza, non ha senso, quindi la scelta appare sociale, non tecnica.
Nick Cox,

2
@NickCox, sì, E era un tipo russo, non è un'abbreviazione :) Era una persona enigmatica, questo è tutto ciò che potresti mai trovare su di lui. Ricordo anche un libro molto utile che qualcuno con il suo nome ha scritto su calcolatori programmabili, sì, era una grande cosa all'epoca
Aksakal

1
@amoeba Ha lavorato presso Институт радиотехники и электроники Российской Академии Наук им. Котельникова, scommetto che ha fatto ricerche classificate, il nome completo è Епанечников Виктор Александрович
Aksakal

Risposte:


7

Il motivo per cui il kernel Epanechnikov non è universalmente usato per la sua ottimalità teorica potrebbe benissimo essere che il kernel Epanechnikov non è in realtà teoricamente ottimale . Tsybakov critica esplicitamente l'argomento secondo cui il kernel di Epanechnikov è "teoricamente ottimale" in pagg. 16-19 di Introduzione alla stima non parametrica (sezione 1.2.4).

Cercando di riassumere, sotto alcune ipotesi sul kernel K e una densità fissa p si ha che l'errore quadratico integrato medio è, della forma

(1)1nhK2(u)du+h44SK2(p(x))2dx.

La critica principale di Tsybakov sembra essere minimizzare rispetto ai kernel non negativi, poiché spesso è possibile ottenere stimatori con prestazioni migliori, che sono anche non negativi, senza limitarsi ai kernel non negativi.

Il primo passo dell'argomento per il kernel Epanechnikov inizia minimizzando (1) su h e tutti i kernel non negativi (anziché tutti i kernel di una classe più ampia) per ottenere una larghezza di banda "ottimale" per K

hMISE(K)=(K2nSK2(p)2)1/5

e il kernel "ottimale" (Epanechnikov)

K(u)=34(1u2)+

il cui errore quadrato integrato medio è:

hMISE(K)=(15n(p)2)1/5.

Queste tuttavia non sono scelte possibili, poiché dipendono dalla conoscenza (tramite p ) della densità sconosciuta p - quindi sono quantità "oracolari".

Una proposta di Tsybakov implica che il MISE asintotico per l'oracolo di Epanechnikov è:

(2)limnn4/5Ep(pnE(x)p(x))2dx=34/551/54((p(x))2dx)1/5.

Tsybakov afferma che (2) viene spesso affermato come il MISE migliore ottenibile, ma poi mostra che si possono usare kernel di ordine 2 (per cui SK=0 ) per costruire stimatori del kernel, per ogni ε>0 , in modo tale che

lim supnn4/5Ep(p^n(x)p(x))2dxε.

Anche se p n non è necessariamente non negativo, si ha ancora lo stesso risultato per la parte stimatore positivo, p + n : = max ( 0 , p n ) (che è garantito per essere non negativo anche se K non è):p^npn+:=max(0,p^n)K

lim supnn4/5Ep(pn+(x)p(x))2dxε.

Pertanto, per ε abbastanza piccolo, esistono veri stimatori che hanno MISE asintotico più piccolo dell'oracolo di Epanechnikov , anche usando gli stessi presupposti sulla densità sconosciuta p .

In particolare, si ha di conseguenza che l'infimo del MISE asintotico per una p fissa su tutti gli stimatori del kernel (o parti positive degli stimatori del kernel) è 0 . Quindi l'oracolo di Epanechnikov non è nemmeno vicino a essere ottimale, anche se confrontato con veri stimatori.

Il motivo per cui le persone hanno avanzato l'argomento per l'oracolo di Epanechnikov in primo luogo è che spesso si sostiene che il kernel stesso dovrebbe essere non negativo perché la densità stessa non è negativa. Ma come sottolinea Tsybakov, non si deve presumere che il kernel sia non negativo per ottenere stimatori di densità non negativi, e consentendo ad altri kernel si possono stimatori di densità non negativi che (1) non sono oracoli e (2) eseguire arbitrariamente meglio dell'oracolo di Epanechnikov per un p fisso . Tsybakov usa questa discrepanza per sostenere che non ha senso discutere di ottimalità in termini di una p fissa , ma solo per proprietà di ottimalità che sono uniformi su una classedi densità. Sottolinea inoltre che l'argomento funziona ancora quando si utilizza MSE anziché MISE.

EDIT: vedi anche Corollary 1.1. a p.25, in cui il kernel Epanechnikov viene mostrato come inammissibile in base a un altro criterio. Tsybakov sembra davvero non amare il kernel Epanechnikov.


4
+1 per una lettura interessante, ma questo non risponde al motivo per cui il kernel gaussiano viene usato più spesso del kernel Epanechnikov: sono entrambi non negativi.
ameba dice Ripristina Monica il

@amoeba Questo è vero. Per lo meno questo risponde alla domanda nel titolo, che riguarda solo il kernel Epanechnikov. (Vale a dire che affronta la premessa per la domanda e dimostra che è falso.)
Chill2Macht

3
+1 , la stima della densità in generale non sarà una densità valida (poiché stai tagliando la massa e non si integra più con 1). Se in realtà ti preoccupi solo di MSE, non importa, ma a volte questo sarà un problema significativo.
Dougal,

2

Il kernel gaussiano viene utilizzato ad esempio nella stima della densità tramite derivati:

difdxi(x)1bandwidthj=1Ndikdxi(Xj,x)

Questo perché il kernel di Epanechnikov ha 3 derivati ​​prima che sia identicamente zero, a differenza del gaussiano che ha infinitamente molti derivati ​​(diversi da zero). Vedere la sezione 2.10 nel collegamento per ulteriori esempi.


2
Il primo derivato del kernel Epanechnikov (nota il secondo n , a proposito) non è continuo dove la funzione attraversa i limiti del kernel; questo potrebbe essere più un problema.
Glen_b -Restate Monica

@Glen_b: Probabilmente hai ragione, anche se dopo aver derivato 0 iosarebbe anche sciocco.
Alex R.

1
@AlexR. Mentre quello che dici è vero, non capisco come spieghi perché il gaussiano sia così comune nella stima della densità ordinaria (al contrario della stima della derivata della densità). E anche quando si stimano i derivati, la sezione 2.10 suggerisce che il gaussiano non è mai il kernel preferito.
John Rauser,

@JohnRauser: tieni presente che devi usare i kernel Epanechnikov di ordine superiore per l'ottimalità. Di solito le persone usano un gaussiano perché è più facile da lavorare e ha proprietà più belle.
Alex R.

1
@AlexR Mi piacerebbe cavillare su "[u] in pratica le persone usano un gaussiano"; hai dati sistematici sulla frequenza d'uso o questa è solo un'impressione basata sul lavoro che vedi? Vedo spesso i pesi intermedi, ma non direi di più.
Nick Cox,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.