Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

6
Qual è il modo migliore per ricordare la differenza tra sensibilità, specificità, precisione, accuratezza e richiamo?
Nonostante abbia visto questi termini 502847894789 volte, non riesco a ricordare per la vita di me la differenza tra sensibilità, specificità, precisione, accuratezza e richiamo. Sono concetti piuttosto semplici, ma i nomi per me non sono molto intuitivi, quindi continuo a confonderli. Qual è un buon modo di pensare a …






6
La "valutazione media" di Amazon è fuorviante?
Se ho capito bene, le valutazioni dei libri su una scala 1-5 sono punteggi Likert. Cioè, un 3 per me potrebbe non essere necessariamente un 3 per qualcun altro. È un IMO su scala ordinale. Non si dovrebbero veramente medie scale ordinali ma si può sicuramente prendere la modalità, la …

1
Bootstrap vs. jackknife
Entrambi i metodi bootstrap e jackknife possono essere usati per stimare il bias e l'errore standard di una stima e i meccanismi di entrambi i metodi di ricampionamento non sono molto diversi: campionare con la sostituzione vs. tralasciare un'osservazione alla volta. Tuttavia, jackknife non è così popolare come bootstrap nella …




4
Tempo di calcolo casuale della foresta in R
Sto usando il pacchetto party in R con 10.000 righe e 34 funzionalità e alcune funzionalità dei fattori hanno più di 300 livelli. Il tempo di elaborazione è troppo lungo. (Ci sono volute 3 ore finora e non è ancora finito.) Voglio sapere quali elementi hanno un grande effetto sul …
49 r  random-forest 




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.