Sono un po 'confuso con la differenza tra un SVM e un percettrone. Vorrei provare a sintetizzare la mia comprensione qui, e non esitate a correggere dove sbaglio e compilare ciò che ho perso.
Il Perceptron non tenta di ottimizzare la "distanza" di separazione. Finché trova un iperpiano che separa i due set, è buono. SVM d'altra parte cerca di massimizzare il "vettore di supporto", cioè la distanza tra due punti campione opposti più vicini.
L'SVM tenta in genere di utilizzare una "funzione del kernel" per proiettare i punti di campionamento su uno spazio ad alta dimensione per renderli separabili linearmente, mentre il percettrone assume che i punti di campionamento siano separabili linearmente.