Che cos'è un "kernel" in un inglese semplice?


73

Esistono diversi usi distinti:

  • stima della densità del kernel
  • trucco del kernel
  • smoothing del kernel

Spiega cosa significa il "kernel" in loro, in parole povere, con parole tue.


3
Non essere scortese, ma non è questa una domanda a cui è già stata data una risposta alla nausea su Wikipedia e simili? Google mi ha dato la risposta entro 15 secondi ...
Joris Meys,

46
Odio assolutamente le risposte di Wikipedia per le statistiche. Ci sono disordine simbolici e sconclusionati. Sto cercando una gemma di una risposta che possa spiegare la risposta in un inglese semplice, poiché credo che ciò mostri un livello di comprensione più profondo di un'equazione matematica. Ci sono molte domande popolari sul "semplice inglese" qui, e per una buona ragione.
Neil McGuigan,

Risposte:


39

In entrambe le statistiche (stima della densità del kernel o smoothing del kernel) e in machine learning (metodi del kernel), il kernel viene utilizzato come misura di somiglianza. In particolare, la funzione del kernel definisce la distribuzione di somiglianze di punti attorno a un dato punto . indica la somiglianza del punto con un altro dato punto .k(x,.)xk(x,y)xy


Questo è un bel modo di dirlo. Mi chiedo se è possibile generalizzare questa descrizione da applicare anche al kernel di "stima della densità del kernel".
Shabbychef,

2
In un certo senso, sì. Un modo per comprendere la stima della densità del kernel è di approssimare la densità di un punto da una certa distribuzione come media ponderata delle sue somiglianze con una serie di punti dalla distribuzione. Quindi anche la nozione di somiglianza gioca un ruolo qui.
ebony1

1
Capisco "kernel" nelle statistiche che devono essere prese in prestito originariamente dal gergo usato nella discussione delle equazioni integrali.
Nick Cox,

42

Sembra che ci siano almeno due diversi significati di "kernel": uno più comunemente usato in statistica; l'altro nell'apprendimento automatico.

Nelle statistiche "kernel" è comunemente usato per fare riferimento alla stima della densità del kernel e al suo smoothing .

Una spiegazione semplice dei kernel nella stima della densità può essere trovata ( qui ).

Nell'apprendimento automatico il "kernel" viene solitamente utilizzato per fare riferimento al trucco del kernel , un metodo per utilizzare un classificatore lineare per risolvere un problema non lineare "mappando le osservazioni non lineari originali in uno spazio di dimensioni superiori".

Una semplice visualizzazione potrebbe essere quella di immaginare che tutta la classe sia nel raggio dell'origine in un piano x, y (classe : ); e tutta la classe è oltre il raggio in quel piano (classe : ). Non è possibile alcun separatore lineare, ma chiaramente un cerchio di raggio separerà perfettamente i dati. Possiamo trasformare i dati in uno spazio tridimensionale calcolando tre nuove variabili , e0r0x2+y2<r21r1x2+y2>r2rx2y22xy. Le due classi saranno ora separabili da un piano in questo spazio tridimensionale. L'equazione di quell'iperpiano che separa in modo ottimale dove e è , e in questo caso omette . (Se il cerchio è rispetto all'origine, anche l'iperpiano di separazione ottimale varierà in .) Il kernel è la funzione di mappatura che calcola il valore dei dati bidimensionali nello spazio tridimensionale.z1=x2,z2=y2z3=2xyz1+z2=1z3z3

In matematica, ci sono altri usi dei "kernel" , ma questi sembrano essere i principali in statistica.


1
Molto bella! Userò il tuo esempio con il cerchio per spiegare i metodi del kernel, poiché è la migliore visualizzazione che ho incontrato fino ad ora. Grazie!
Joris Meys,

1
Seguendo l'esempio di Thylacoleo usando il cerchio per spiegare il trucco del kernel (non ho abbastanza reputazione per aggiungere un commento direttamente alla sua risposta) C'era un semplice errore nell'equazione per l'iperpiano di separazione? e dovrebbe essere z1 + z2 = r ^ 2, invece di z1 + z2 = 1? O fraintendere? Sono d'accordo è un bell'esempio semplice per illustrare il concetto. Grazie. Sebbene la definizione di z3 sembri ancora un po 'un mistero, ma apparentemente non ha importanza per l'esempio centrato sull'origine.
Alex Blakemore,

Sì, c'era un errore di battitura. Grazie Alex. Non sempre correggo le bozze :-)
Thylacoleo,

1
Il seguente video è stato proposto da un potenziale editore anonimo come "un'ottima visualizzazione di ciò che Thylacoleo ha spiegato:" youtube.com/watch?v=3liCbRZPrZA
gung - Reinstate Monica

Usiamo prodotti interni per mappare i dati bidimensionali su tridimensionali?
SmallChess,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.