"Alberi di classificazione e regressione". CART è una popolare tecnica di apprendimento automatico e costituisce la base per tecniche come foreste casuali e implementazioni comuni di macchine per il potenziamento del gradiente.
In molti algoritmi di machine learning, il ridimensionamento delle funzioni (noto anche come ridimensionamento variabile, normalizzazione) è un passaggio di preprocessamento comune Wikipedia - Ridimensionamento delle funzionalità - questa domanda era vicina Domanda n. 41704 - Come e perché funzionano la normalizzazione e il ridimensionamento delle funzioni? Ho due domande …
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
L'incremento dell'albero dei gradienti, come proposto da Friedman, utilizza gli alberi decisionali con Jnodi terminali (= foglie) come apprendenti di base. Esistono diversi modi per far crescere un albero con esattamente Jnodi, ad esempio si può far crescere l'albero in un modo molto profondo prima o in un modo molto …
Questo è solo un esempio che ho riscontrato più volte, quindi non ho dati di esempio. Esecuzione di un modello di regressione lineare in R: a.lm = lm(Y ~ x1 + x2) x1è una variabile continua. x2è categorico e ha tre valori, ad esempio "Basso", "Medio" e "Alto". Tuttavia, l'output …
Supponiamo di avere un campione di due popolazioni: Ae B. Supponiamo che queste popolazioni siano composte da individui e scegliamo di descriverli in termini di caratteristiche. Alcune di queste funzioni sono categoriche (ad esempio, guidano per funzionare?) E alcune sono numeriche (ad esempio, la loro altezza). Chiamiamo queste funzionalità: . …
Sto facendo i compiti sugli alberi decisionali e una delle domande a cui devo rispondere è "Perché gli stimatori sono costruiti su alberi distorti e in che modo l'insacco aiuta a ridurne la varianza?". Ora, so che i modelli troppo equipaggiati tendono ad avere una propensione molto bassa, perché cercano …
Questo documento afferma che in CART, poiché una divisione binaria viene eseguita su una singola covariata ad ogni passaggio, tutte le divisioni sono ortogonali e quindi le interazioni tra covariate non sono considerate. Tuttavia, molti riferimenti molto seri sostengono, al contrario, che la struttura gerarchica di un albero garantisce che …
Sono un nuovo arrivato nell'analisi di sopravvivenza, anche se ho una certa conoscenza della classificazione e della regressione. Per regressione, abbiamo statistiche MSE e R quadrate. Ma come possiamo dire che il modello di sopravvivenza A è superiore al modello di sopravvivenza B oltre a qualche tipo di grafici (curva …
Ho usato rpart.controlper minsplit=2e ho ottenuto i seguenti risultati dalla rpart()funzione. Per evitare un overfitting dei dati, devo usare le split 3 o le split 7? Non dovrei usare split 7? Per favore mi faccia sapere. Variabili effettivamente utilizzate nella costruzione di alberi: [1] ct_a ct_b usr_a Root node error: …
Basato su Gradient Boosting Tree vs Random Forest . GBDT e RF utilizzano strategie diverse per contrastare la distorsione e la variazione. La mia domanda è che posso ricampionare il set di dati (con la sostituzione) per addestrare più GBDT e combinare le loro previsioni come risultato finale? È equivalente …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.