È abbastanza difficile confrontare direttamente kNN e la regressione lineare in quanto sono cose molto diverse, tuttavia, penso che il punto chiave qui sia la differenza tra "modellare " e "avere ipotesi su ".f ( x )f( x )f( x )
Quando si esegue la regressione lineare, si modella specificamente la , spesso qualcosa tra le righe di dove è un termine di rumore gaussiano. Puoi capire che il modello di massima verosimiglianza equivale al modello di errore di somma dei quadrati minima.f ( x ) = w x + ϵ ϵf( x )f( x ) = w x + ϵε
KNN, d'altra parte, come suggerisce il secondo punto, presuppone che potresti approssimare quella funzione con una funzione localmente costante - una misura della distanza tra gli -ses, senza modellare specificamente l'intera distribuzione.X
In altre parole, la regressione lineare avrà spesso una buona idea del valore di per alcuni invisibili solo dal valore di , mentre kNN avrebbe bisogno di alcune altre informazioni (cioè i vicini k), per fare previsioni su , poiché il valore di , e solo il valore stesso, non fornirà alcuna informazione, in quanto non esiste un modello per .x x f ( x ) x f ( x )f( x )XXf( x )Xf( x )
EDIT: ribadendo questo sotto per ri-esprimere questo più chiaro (vedi commenti)
È chiaro che sia la regressione lineare sia i metodi vicini più vicini mirano a prevedere il valore di per una nuova . Ora ci sono due approcci. La regressione lineare prosegue assumendo che i dati cadano su una linea retta (più meno un po 'di rumore), e quindi il valore di y è uguale al valore di la pendenza della linea. In altre parole, l'espressione lineare modella i dati come una linea retta.x f ( x )y= f(x )Xf( x )
Ora i metodi del vicino più vicino non si preoccupano del loro aspetto (non modellano i dati), cioè, non gli importa se si tratta di una linea, una parabola, un cerchio, ecc. Tutto ciò che assume, è che e sarà simile, se e sono simili. Si noti che questo assunto è approssimativamente vero per quasi tutti i modelli, compresi tutti quelli che ho menzionato sopra. Tuttavia, un metodo NN non è in grado di dire in che modo il valore di è correlato a (se si tratta di una linea, parabola, ecc.), Poiché non ha un modello di questa relazione, presuppone che possa essere approssimato da guardando in punti vicini.f ( x 2 ) x 1 x 2 f ( x ) xf( x1)f( x2)X1X2f( x )X