Statistiche e Big Data

8

Funzione obiettivo, funzione costo, funzione perdita: sono la stessa cosa?

Nell'apprendimento automatico, le persone parlano di funzione oggettiva, funzione di costo, funzione di perdita. Sono solo nomi diversi della stessa cosa? Quando usarli? Se non si riferiscono sempre alla stessa cosa, quali sono le differenze?

80 machine-learning terminology artificial-intelligence

8

Calcolo del numero ottimale di bin in un istogramma

Sono interessato a trovare un metodo il più ottimale possibile per determinare quanti contenitori dovrei usare in un istogramma. I miei dati dovrebbero variare al massimo da 30 a 350 oggetti, e in particolare sto cercando di applicare il limite (come il metodo di Otsu) in cui gli oggetti "buoni", …

80 rule-of-thumb histogram

2

Divergenza di KL tra due gaussiani univariati

Devo determinare la divergenza KL tra due gaussiani. Sto confrontando i miei risultati con questi , ma non riesco a riprodurli. Il mio risultato è ovviamente sbagliato, perché KL non è 0 per KL (p, p). Mi chiedo dove sto facendo un errore e chiedo se qualcuno può individuarlo. Sia …

79 normal-distribution kullback-leibler

9

Probabilità di un singolo evento futuro nella vita reale: cosa significa quando dicono che "Hillary ha il 75% di possibilità di vincere"?

Poiché le elezioni sono un evento unico, non è un esperimento che può essere ripetuto. Quindi, cosa significa tecnicamente esattamente l'affermazione "Hillary ha il 75% di possibilità di vincere" ? Sto cercando una definizione statisticamente corretta non intuitiva o concettuale. Sono un fan delle statistiche amatoriali che sta cercando di …

79 probability prediction politics

7

The Book of Why di Judea Pearl: Perché sta rubando le statistiche?

Sto leggendo Il libro del perché di Judea Pearl, e mi sta prendendo in giro 1 . In particolare, mi sembra che stia incondizionatamente basando le statistiche "classiche" sollevando un argomento da pagliaccia secondo cui le statistiche non sono mai, mai in grado di indagare sulle relazioni causali, che non …

79 causality

5

Qual è la differenza tra apprendimento off-policy e on-policy?

Il sito Web di intelligenza artificiale definisce l'apprendimento off-policy e on-policy come segue: "Uno studente fuori dalla politica impara il valore della politica ottimale indipendentemente dalle azioni dell'agente. Q-learning è uno studente fuori dalla politica. Uno studente nella politica apprende il valore della politica eseguita dall'agente, compresi i passaggi di …

79 machine-learning reinforcement-learning artificial-intelligence

6

Come stabilire se i dati sono "raggruppati" abbastanza per consentire agli algoritmi di raggruppamento di produrre risultati significativi?

Come faresti a sapere se i tuoi dati (ad alta dimensione) mostrano un clustering sufficiente in modo che i risultati provenienti da kmean o altri algoritmi di clustering siano effettivamente significativi? Per l'algoritmo k-mean in particolare, quanto dovrebbe essere significativa una riduzione della varianza all'interno del cluster affinché i risultati …

78 clustering k-means

21

Risorse gratuite per l'apprendimento R

Sono interessato a imparare R a basso costo. Qual è la migliore risorsa / libro / tutorial gratuito per l'apprendimento di R?

78 r references

5

Come calcolare l'Area Under the Curve (AUC), o la statistica c, a mano

Sono interessato a calcolare manualmente l'area sotto la curva (AUC), o statistica c, per un modello di regressione logistica binaria. Ad esempio, nel set di dati di convalida, ho il valore reale per la variabile dipendente, retention (1 = mantenuto; 0 = non mantenuto), nonché uno stato di conservazione previsto …

78 regression logistic classification roc auc

3

Un esempio: regressione di LASSO utilizzando glmnet per il risultato binario

Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …

78 r self-study lasso regression interpretation anova statistical-significance survey conditional-probability independence naive-bayes graphical-model r time-series forecasting arima r forecasting exponential-smoothing bootstrap outliers r regression poisson-distribution zero-inflation genetic-algorithms machine-learning feature-selection cart categorical-data interpretation descriptive-statistics variance multivariate-analysis covariance-matrix r data-visualization generalized-linear-model binomial proportion pca matlab svd time-series correlation spss arima chi-squared curve-fitting text-mining zipf probability categorical-data distance group-differences bhattacharyya regression variance mean data-visualization variance clustering r standard-error association-measure somers-d normal-distribution integral numerical-integration bayesian clustering python pymc nonparametric-bayes machine-learning svm kernel-trick hyperparameter poisson-distribution mean continuous-data univariate missing-data dag python likelihood dirichlet-distribution r anova hypothesis-testing statistical-significance p-value rating data-imputation censoring threshold

7

Qual è il vantaggio di spezzare una variabile predittiva continua?

Mi chiedo quale sia il valore nel prendere una variabile predittiva continua e scomporla (ad es. In quintili), prima di usarla in un modello. Mi sembra che, binning della variabile, perdiamo informazioni. È solo per poter modellare effetti non lineari? Se mantenessimo la variabile continua e in realtà non fosse …

78 regression modeling continuous-data binning regression-strategies

3

Quando è R al quadrato negativo?

La mia comprensione è che non può essere negativo in quanto è il quadrato di R. Tuttavia ho eseguito una semplice regressione lineare in SPSS con una singola variabile indipendente e una variabile dipendente. Il mio output SPSS mi dà un valore negativo per . Se dovessi calcolare questo a …

78 regression spss r-squared

6

Clustering sull'output di t-SNE

Ho un'applicazione in cui sarebbe utile raggruppare un set di dati rumorosi prima di cercare effetti di sottogruppo all'interno dei cluster. Ho esaminato PCA per la prima volta, ma sono necessari circa 30 componenti per arrivare al 90% della variabilità, quindi il clustering su un paio di PC genererà molte …

78 clustering interpretation k-means tsne

1

Correlazione tra una variabile nominale (IV) e una continua (DV)

Ho una variabile nominale (diversi argomenti di conversazione, codificata come topic0 = 0 ecc.) E un numero di variabili di scala (DV) come la durata di una conversazione. Come posso derivare correlazioni tra le variabili nominali e di scala?

77 correlation continuous-data categorical-data

3

Come produrre un bel diagramma dei risultati dell'analisi dei cluster di k-mean?

Sto usando R per fare il clustering di K-significa. Sto usando 14 variabili per eseguire K-medie Qual è un modo carino per tracciare i risultati di K-mean? Ci sono implementazioni esistenti? Avere 14 variabili complica la rappresentazione dei risultati? Ho trovato qualcosa chiamato GGcluster che sembra bello ma è ancora …

77 data-visualization classification k-means unsupervised-learning