Domande taggate «machine-learning»

Gli algoritmi di machine learning costruiscono un modello dei dati di training. Il termine "apprendimento automatico" è vagamente definito; include ciò che è anche chiamato apprendimento statistico, apprendimento di rinforzo, apprendimento senza supervisione, ecc. AGGIUNGI SEMPRE UN TAG PIÙ SPECIFICO.




1
Quando le classi sbilanciate in eccesso o in sottocampionamento, la massimizzazione della precisione differisce dalla minimizzazione dei costi di classificazione errata?
Prima di tutto, vorrei descrivere alcuni layout comuni utilizzati dai libri di Data Mining spiegando come gestire i set di dati non bilanciati . Di solito la sezione principale è denominata set di dati non bilanciati e copre queste due sottosezioni: classificazione sensibile ai costi e tecniche di campionamento. Sembra …


1
Interpretazione della distanza dall'iperpiano in SVM
Ho qualche dubbio nel comprendere intuitivamente gli SVM. Supponiamo di aver addestrato un modello SVM per la classificazione utilizzando alcuni strumenti standard come SVMLight o LibSVM. Quando utilizziamo questo modello per la previsione sui dati di test, il modello genera un file con valori "alfa" per ciascun punto di test. …

1
Quando si vorrebbe usare AdaBoost?
Come ho sentito parlare del classificatore AdaBoost più volte menzionato al lavoro, volevo avere un'idea migliore di come funziona e quando si potrebbe desiderare di usarlo. Sono andato avanti e ho letto una serie di articoli e tutorial che ho trovato su Google, ma ci sono aspetti del classificatore che …


2
Perché la stima OOB della foresta casuale di errore migliora quando si riduce il numero di funzionalità selezionate?
Sto applicando un algoritmo di foresta casuale come classificatore su un set di dati di microarray che sono divisi in due gruppi noti con migliaia di funzionalità. Dopo la corsa iniziale guardo l'importanza delle funzionalità ed eseguo di nuovo l'algoritmo dell'albero con le funzionalità più importanti 5, 10 e 20. …



1
Caret glmnet vs cv.glmnet
Sembra esserci molta confusione nel confronto tra l'uso di glmnetinside caretper cercare un lambda ottimale e l'utilizzo cv.glmnetper fare lo stesso compito. Sono state poste molte domande, ad esempio: Modello di classificazione train.glmnet vs. cv.glmnet? Qual è il modo corretto di usare glmnet con il cursore? Convalida incrociata di `glmnet` …

4
Intervalli di previsione per algoritmi di apprendimento automatico
Voglio sapere se il processo descritto di seguito è valido / accettabile e qualsiasi giustificazione disponibile. L'idea: gli algoritmi di apprendimento supervisionato non assumono strutture / distribuzioni sottostanti sui dati. Alla fine della giornata forniscono stime dei punti. Spero in qualche modo di quantificare l'incertezza delle stime. Ora, il processo …


1
GAM vs LOESS vs spline
Contesto : Voglio tracciare una linea in un grafico a dispersione che non appare parametrico, quindi sto usando geom_smooth()in ggplota R. Restituisce automaticamente geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.