Domande taggate «categorical-data»

I dati categorici (detti anche nominali) possono assumere un numero limitato di possibili valori chiamati categorie. I valori categorici "etichetta", non "misurano". Utilizzare il tag [dati ordinali] per tipi di dati discreti ma ordinati.

6
L'analisi dei componenti principali può essere applicata a set di dati contenenti una combinazione di variabili continue e categoriali?
Ho un set di dati che contiene sia dati continui che categorici. Sto analizzando usando PCA e mi chiedo se sia giusto includere le variabili categoriali come parte dell'analisi. La mia comprensione è che PCA può essere applicato solo a variabili continue. È corretto? Se non può essere utilizzato per …


3
Un esempio: regressione di LASSO utilizzando glmnet per il risultato binario
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


6
Modo di principio di collasso delle variabili categoriali con molti livelli?
Quali tecniche sono disponibili per il collasso (o il raggruppamento) di molte categorie a poche, allo scopo di usarle come input (predittore) in un modello statistico? Considera una variabile come quella di uno studente universitario (disciplina scelta da uno studente universitario). Non è ordinato e categorico, ma può potenzialmente avere …





5
Correlazioni tra variabili continue e categoriali (nominali)
Vorrei trovare la correlazione tra una variabile continua (variabile dipendente) e una categorica (nominale: genere, variabile indipendente). I dati continui non vengono normalmente distribuiti. Prima l'avevo calcolato usando Spearman's . Tuttavia, mi è stato detto che non è giusto.ρρ\rho Durante la ricerca su Internet, ho scoperto che il boxplot può …




3


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.