Statistiche e Big Data cart

2

Chi ha inventato l'albero delle decisioni?

Sto cercando di rintracciare chi ha inventato la struttura e l'algoritmo dei dati dell'albero decisionale. Nella voce di Wikipedia sull'apprendimento dell'albero decisionale si afferma che "ID3 e CART sono stati inventati indipendentemente nello stesso periodo (tra il 1970 e il 1980)". ID3 è stato presentato più tardi in: Quinlan, JR …

24 cart history

2

CHAID vs CRT (o CART)

Sto eseguendo una classificazione dell'albero decisionale utilizzando SPSS su un set di dati con circa 20 predittori (categorico con poche categorie). CHAID (Rilevazione automatica dell'interazione Chi-quadrato) e CRT / CART (alberi di classificazione e regressione) mi danno alberi diversi. Qualcuno può spiegare i meriti relativi di CHAID vs CRT? Quali …

23 spss cart

5

Alternative agli alberi di classificazione, con migliori prestazioni predittive (ad es. CV)?

Sto cercando un'alternativa agli alberi di classificazione che potrebbe produrre un migliore potere predittivo. I dati con cui ho a che fare hanno fattori sia per le variabili esplicative che per quelle spiegate. Ricordo di essermi imbattuto in foreste casuali e reti neurali in questo contesto, sebbene non le avessi …

23 r machine-learning classification cart

1

In che modo gli algoritmi di apprendimento dell'albero decisionale affrontano i valori mancanti (sotto il cofano)

Quali sono i metodi utilizzati dagli algoritmi di apprendimento dell'albero decisionale per gestire i valori mancanti. Semplicemente riempiono lo slot usando un valore chiamato missing? Grazie.

21 missing-data cart

2

Qual è la relazione tra il punteggio GINI e il rapporto log-verosimiglianza

Sto studiando gli alberi di classificazione e regressione e una delle misure per la posizione divisa è il punteggio GINI. Ora sono abituato a determinare la migliore posizione divisa quando il registro del rapporto di verosimiglianza degli stessi dati tra due distribuzioni è zero, il che significa che la probabilità …

21 cart likelihood-ratio information-theory kullback-leibler gini

4

Gli alberi decisionali sono quasi sempre alberi binari?

Quasi ogni esempio di albero decisionale che ho incontrato sembra essere un albero binario. È praticamente universale? La maggior parte degli algoritmi standard (C4.5, CART, ecc.) Supporta solo alberi binari? Da quello che raccolgo, CHAID non si limita agli alberi binari, ma sembra essere un'eccezione. Una divisione a due vie …

21 machine-learning data-mining cart

4

Come proiettare un nuovo vettore nello spazio PCA?

Dopo aver eseguito l'analisi dei componenti principali (PCA), voglio proiettare un nuovo vettore nello spazio PCA (ovvero trovare le sue coordinate nel sistema di coordinate PCA). Ho calcolato PCA in linguaggio R utilizzando prcomp. Ora dovrei essere in grado di moltiplicare il mio vettore per la matrice di rotazione PCA. …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

4

Esiste un algoritmo simile a un albero decisionale per il clustering senza supervisione?

Ho un set di dati composto da 5 funzioni: A, B, C, D, E. Sono tutti valori numerici. Invece di fare un clustering basato sulla densità, quello che voglio fare è raggruppare i dati in modo simile ad un albero decisionale. L'approccio intendo è qualcosa del genere: L'algoritmo può dividere …

20 r machine-learning clustering cart

2

In che modo la foresta casuale genera la foresta casuale

Non sono un esperto di foreste casuali ma capisco chiaramente che il problema chiave con la foresta casuale è la generazione di alberi (casuali). Puoi spiegarmi come vengono generati gli alberi? (ovvero qual è la distribuzione utilizzata per la generazione di alberi?) Grazie in anticipo !

20 machine-learning r algorithms cart random-forest

3

Un moncone di decisione è un modello lineare?

Ceppo decisionale è un albero decisionale con una sola divisione. Può anche essere scritto come una funzione a tratti. Ad esempio, supponiamo che xxx sia un vettore e x1x1x_1 sia il primo componente di xxx , nell'impostazione di regressione, un moncone di decisione può essere f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 …

19 machine-learning cart linear boosting

1

Che cos'è lo "spazio funzioni"?

Qual è la definizione di "spazio funzionalità"? Ad esempio, durante la lettura di SVM, ho letto di "mapping allo spazio delle caratteristiche". Durante la lettura di CART, ho letto di "partizionare nello spazio delle funzionalità". Capisco cosa sta succedendo, specialmente per CART, ma penso che ci sia qualche definizione che …

19 machine-learning svm feature-selection cart feature-construction

3

La foresta casuale per la regressione è una regressione "vera"?

Le foreste casuali vengono utilizzate per la regressione. Tuttavia, da quello che ho capito, assegnano un valore target medio ad ogni foglia. Dato che ci sono solo foglie limitate in ogni albero, ci sono solo valori specifici che il target può raggiungere dal nostro modello di regressione. Quindi non è …

18 regression random-forest cart

2

Apprendimento profondo vs. alberi decisionali e metodi di potenziamento

Sto cercando documenti o testi che confrontino e discutano (empiricamente o teoricamente): Accrescere e Decision Trees algoritmi come casuali Foreste o AdaBoost e GentleBoost applicati agli alberi decisionali. con Metodi di apprendimento profondo come macchine Boltzmann limitate , memoria temporale gerarchica , reti neurali convoluzionali , ecc. Più specificamente, qualcuno …

18 machine-learning deep-learning cart rbm adaboost

1

Qual è la dimensione VC di un albero decisionale?

Qual è la dimensione VC di un albero decisionale con k si divide in due dimensioni? Diciamo che il modello è CART e le uniche divisioni consentite sono parallele agli assi. Quindi per una divisione possiamo ordinare 3 punti in un triangolo e quindi per qualsiasi etichettatura dei punti potremmo …

17 cart vc-dimension

1

Boosting AND Bagging Trees (XGBoost, LightGBM)

Ci sono molti post sul blog, video di YouTube, ecc. Sulle idee di insaccamento o potenziamento degli alberi. La mia comprensione generale è che lo pseudo codice per ciascuno è: insacco: Prendi N campioni casuali di x% dei campioni e y% delle caratteristiche Adatta il tuo modello (ad es. Albero …

17 cart boosting xgboost bagging

Domande taggate «cart»