Support Vector Machine si riferisce a "un insieme di metodi di apprendimento supervisionato correlati che analizzano i dati e riconoscono i modelli, utilizzati per l'analisi di classificazione e regressione".
Attualmente sto usando un SVM con un kernel lineare per classificare i miei dati. Non ci sono errori sul set di allenamento. Ho provato diversi valori per il parametro ( ). Ciò non ha modificato l'errore sul set di test.10 - 5 , … , 10 2CCC10- 5, ... , …
Come funziona una macchina Support Vector (SVM) di lavoro, e ciò che lo differenzia dagli altri classificatori lineari, come ad esempio il Perceptron Lineare , Lineare Analisi Discriminante , o regressione logistica ? * (* Sto pensando in termini di motivazioni alla base dell'algoritmo, strategie di ottimizzazione, capacità di generalizzazione …
Molti classificatori di machine learning (ad es. Supportano macchine vettoriali) consentono di specificare un kernel. Quale sarebbe un modo intuitivo per spiegare cos'è un kernel? Un aspetto a cui ho pensato è la distinzione tra kernel lineari e non lineari. In termini semplici, potrei parlare di "funzioni di decisione lineari" …
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
Comprendo le basi di quale sia l'obiettivo di Support Vector Machines in termini di classificazione di un set di input in diverse classi, ma ciò che non capisco sono alcuni dettagli chiacchieroni. Per cominciare, sono un po 'confuso dall'uso di Slack Variables. Qual è il loro scopo? Sto riscontrando un …
Stavo leggendo del kernel PCA ( 1 , 2 , 3 ) con kernel gaussiani e polinomiali. In che modo il kernel gaussiano separa apparentemente eccezionalmente bene qualsiasi tipo di dati non lineari? Si prega di fornire un'analisi intuitiva, oltre a una matematicamente coinvolta, se possibile. Qual è una proprietà …
Molti autori di articoli che leggo affermano che le SVM sono tecniche superiori per affrontare il loro problema di regressione / classificazione, consapevoli di non poter ottenere risultati simili attraverso le NN. Spesso il confronto afferma che SVM, anziché NN, Avere una forte teoria fondante Raggiungi l'ottimale globale grazie alla …
Dati i punti dati e le etichette , il problema principale SVM del margine rigido èx1,…,xn∈Rdx1,…,xn∈Rdx_1, \ldots, x_n \in \mathbb{R}^dy1,…,yn∈{−1,1}y1,…,yn∈{−1,1}y_1, \ldots, y_n \in \left \{-1, 1 \right\} minimizew,w012wTwminimizew,w012wTw \text{minimize}_{w, w_0} \quad \frac{1}{2} w^T w s.t.∀i:yi(wTxi+w0)≥1s.t.∀i:yi(wTxi+w0)≥1 \text{s.t.} \quad \forall i: y_i (w^T x_i + w_0) \ge 1 che è un programma …
La Discesa a Gradiente ha il problema di rimanere bloccati nei Minimi Locali. Dobbiamo eseguire tempi esponenziali di discesa gradiente per trovare minimi globali. Qualcuno può parlarmi di qualsiasi alternativa alla discesa gradiente applicata nell'apprendimento della rete neurale, insieme ai suoi pro e contro.
Negli ultimi anni, le reti neurali convoluzionali (CNN) sono diventate lo stato dell'arte per il riconoscimento degli oggetti nella visione artificiale. In genere, una CNN è composta da diversi livelli convoluzionali, seguiti da due livelli completamente collegati. Un'intuizione alla base di ciò è che i livelli convoluzionali apprendono una migliore …
Quando si utilizza la macchina vettoriale di supporto, esistono delle linee guida per la scelta del kernel lineare rispetto al kernel non lineare, come RBF? Una volta ho sentito che il kernel non lineare tende a non funzionare bene quando il numero di funzionalità è grande. Ci sono riferimenti su …
Sto cercando di interpretare i pesi variabili dati montando un SVM lineare. (Sto usando Scikit-Learn ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ Non riesco a trovare nulla nella documentazione che specifichi specificamente come questi pesi vengono calcolati o interpretati. Il segno del peso ha qualcosa a …
Qualcuno può darmi qualche intuizione su quando scegliere SVM o LR? Voglio capire l'intuizione dietro qual è la differenza tra i criteri di ottimizzazione dell'apprendimento dell'iperpiano dei due, in cui i rispettivi obiettivi sono i seguenti: SVM: prova a massimizzare il margine tra i vettori di supporto più vicini LR: …
Il mio set di dati è piccolo (120 campioni), tuttavia il numero di funzionalità è grande varia da (1000-200.000). Anche se sto facendo la selezione delle funzionalità per scegliere un sottoinsieme di funzionalità, potrebbe comunque essere troppo adatto. La mia prima domanda è: in che modo SVM gestisce l'overfitting, se …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.