Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



2
Gradient Boosting Tree vs Random Forest
Il potenziamento dell'albero a gradiente, come proposto da Friedman, utilizza gli alberi decisionali come apprendenti di base. Mi chiedo se dovremmo rendere l'albero delle decisioni di base il più complesso possibile (completamente sviluppato) o più semplice? C'è qualche spiegazione per la scelta? Random Forest è un altro metodo di ensemble …









4
Qual è la regola .632+ nel bootstrap?
Qui @gung fa riferimento alla regola .632+. Una rapida ricerca su Google non fornisce una risposta di facile comprensione su cosa significhi questa regola e per quale scopo venga utilizzata. Qualcuno potrebbe chiarire la regola .632+?
107 bootstrap 


7
Perché l'accuratezza non è la misura migliore per valutare i modelli di classificazione?
Questa è una domanda generale che è stata posta indirettamente più volte qui, ma manca di un'unica risposta autorevole. Sarebbe bello avere una risposta dettagliata a questo per il riferimento. La precisione , la proporzione di classificazioni corrette tra tutte le classificazioni, è una misura molto semplice e molto "intuitiva", …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.