Domande taggate «machine-learning»

Gli algoritmi di machine learning costruiscono un modello dei dati di training. Il termine "apprendimento automatico" è vagamente definito; include ciò che è anche chiamato apprendimento statistico, apprendimento di rinforzo, apprendimento senza supervisione, ecc. AGGIUNGI SEMPRE UN TAG PIÙ SPECIFICO.

2
Sulla "forza" dei discenti deboli
Ho diverse domande strettamente correlate riguardanti gli studenti deboli nell'apprendimento in gruppo (ad es. Il potenziamento). Questo può sembrare stupido, ma quali sono i vantaggi dell'utilizzo di studenti deboli piuttosto che forti? (es. perché non potenziare con metodi di apprendimento "forti"?) Esiste una sorta di forza "ottimale" per gli studenti …





3
Perché Lars e Glmnet offrono soluzioni diverse per il problema del lazo?
Voglio capire meglio i pacchetti R Larse Glmnet, che sono usati per risolvere il problema Lazo: (per Variabili e campioni, vedi www.stanford.edu/~hastie/Papers/glmnet.pdf a pagina 3)pNm i n( β0β) ∈ Rp + 1[ 12 NΣi = 1N( yio- β0- xTioβ)2+ λ | | β| |l1]mion(β0β)∈Rp+1[12NΣio=1N(yio-β0-XioTβ)2+λ||β||l1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + \lambda||\beta …

8
Esegui il clustering di K-medie (o dei suoi parenti stretti) con solo una matrice di distanza, non dati punto per caratteristica
Voglio eseguire il clustering dei mezzi K sugli oggetti che ho, ma gli oggetti non sono descritti come punti nello spazio, cioè per objects x featuresset di dati. Tuttavia, sono in grado di calcolare la distanza tra due oggetti qualsiasi (si basa su una funzione di somiglianza). Quindi, dispongo della …


1
Eliminazione di una delle colonne quando si utilizza la codifica a caldo
La mia comprensione è che nell'apprendimento automatico può essere un problema se il tuo set di dati ha caratteristiche altamente correlate, poiché codificano effettivamente le stesse informazioni. Recentemente qualcuno ha sottolineato che quando si esegue la codifica one-hot su una variabile categoriale si finisce con funzionalità correlate, quindi è necessario …

2
Quando dovremmo discretizzare / binare variabili / caratteristiche indipendenti continue e quando no?
Quando dovremmo discretizzare / binare variabili / caratteristiche indipendenti e quando no? I miei tentativi di rispondere alla domanda: In generale, non dovremmo fare il bin, perché il binning perderà informazioni. Il binning sta effettivamente aumentando il grado di libertà del modello, quindi è possibile causare un eccesso di adattamento …

4
Gli algoritmi di Machine Learning o Deep Learning possono essere utilizzati per "migliorare" il processo di campionamento di una tecnica MCMC?
Sulla base della scarsa conoscenza che ho dei metodi MCMC (Markov chain Monte Carlo), capisco che il campionamento è una parte cruciale della tecnica di cui sopra. I metodi di campionamento più comunemente usati sono Hamiltoniano e Metropolis. Esiste un modo per utilizzare l'apprendimento automatico o anche l'apprendimento profondo per …





Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.