Quanto è differente Support Vector Regressione rispetto a SVM?

Conosco le basi di SVM e SVR, ma ancora non capisco come il problema di trovare un iperpiano che massimizzi il margine si adatti a SVR.

In secondo luogo, ho letto qualcosa su usato come margine di tolleranza in SVR. Cosa significa? $\epsilon$

Terzo, c'è qualche differenza tra i parametri delle funzioni decisionali utilizzati in SVM e SVR?

regression machine-learning svm

— encodeflush
fonte

Ho tentato di spiegarlo in modo pittorico usando la vista laterale stats.stackexchange.com/questions/82044/…

— Lejafar,

SVM, sia per la classificazione che per la regressione, riguarda l'ottimizzazione di una funzione tramite una funzione di costo, tuttavia la differenza sta nella modellazione dei costi.

Considera questa illustrazione di una macchina vettoriale di supporto utilizzata per la classificazione.

Poiché il nostro obiettivo è una buona separazione delle due classi, proviamo a formulare un confine che lasci il margine il più ampio possibile tra le istanze che sono più vicine ad esso (vettori di supporto), con possibilità che cadano in questo margine sia una possibilità, anche se incorrere in un costo elevato (nel caso di un margine debole SVM).

$\epsilon$

$\xi_+, \xi_-$ $\epsilon$

Questo ci dà il problema dell'ottimizzazione (vedi E. Alpaydin, Introduzione all'apprendimento automatico, 2a edizione)

m io n \frac{1}{2} | | w | |^{2} + C \underset{t}{Σ} (ξ_{+} + ξ_{-})

$min \frac{1}{2} ||w||^2 + C\sum_{t} (\xi_+ + \xi_-)$

soggetto a

r^{t} - (w^{T} X + w_{0}) \leq ε + ξ_{+}^{t} (w^{T} X + w_{0}) - r^{t} \leq ε + ξ_{-}^{t} ξ_{+}^{t}, ξ_{-}^{t} \geq 0

$r^t - (\textbf{w}^T \textbf{x} + w_0) \leq \epsilon + \xi_{+}^{t}\\ (\textbf{w}^T \textbf{x} + w_0)-r^t \leq \epsilon + \xi_{-}^{t}\\ \xi_{+}^{t},\xi_{-}^{t} \geq 0$

Istanze al di fuori del margine di regressione SVM sostiene costi nell'ottimizzazione, quindi il tentativo di minimizzare questo costo come parte dell'ottimizzazione perfeziona la nostra funzione decisionale, ma in realtà non massimizza il margine come sarebbe il caso della classificazione SVM.

Questo avrebbe dovuto rispondere alle prime due parti della tua domanda.

$\epsilon$ $C$ $\gamma$

— deemel
fonte