Domande taggate «outliers»

Un valore anomalo è un'osservazione che sembra essere insolita o non ben descritta rispetto a una semplice caratterizzazione di un set di dati. Una possibilità sconcertante è che questi dati provengano da una popolazione diversa da quella che si intende studiare.


6
Test di controllo dei dati essenziali
Nel mio ruolo lavorativo lavoro spesso con set di dati di altre persone, i non esperti mi portano dati clinici e li aiuto a riassumere ed eseguire test statistici. Il problema che sto riscontrando è che i set di dati che mi vengono proposti sono quasi sempre pieni di errori …

1
Interpretazione plot.lm ()
Avevo una domanda sull'interpretazione dei grafici generati dalla trama (lm) in R. Mi stavo chiedendo se potreste dirmi come interpretare i grafici della posizione in scala e della leva residua? Eventuali commenti sarebbero apprezzati. Assumi le conoscenze di base di statistica, regressione ed econometria.



3
Un esempio: regressione di LASSO utilizzando glmnet per il risultato binario
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


8
Genera una variabile casuale con una correlazione definita con una o più variabili esistenti
Per uno studio di simulazione devo generare variabili casuali che mostrano una correlazione (popolazione) predefinita a una variabile esistente .YYY Ho esaminato i Rpacchetti copulae CDVineche possono produrre distribuzioni multivariate casuali con una determinata struttura di dipendenza. Tuttavia, non è possibile fissare una delle variabili risultanti su una variabile esistente. …


8
Definizione rigorosa di un valore anomalo?
Le persone spesso parlano di come gestire i valori anomali nelle statistiche. La cosa che mi preoccupa di questo è che, per quanto ne so, la definizione di un outlier è completamente soggettiva. Ad esempio, se la vera distribuzione di una variabile casuale è molto pesante o bimodale, qualsiasi visualizzazione …

1
Rilevamento di valori anomali nelle serie temporali (LS / AO / TC) utilizzando il pacchetto tsoutliers in R. Come rappresentare i valori anomali in formato equazione?
Commenti: Prima di tutto vorrei dire un grande grazie al autore del nuovo tsoutliers pacchetto che implementa Chen e Liu di rilevazione delle serie storiche dei valori anomali che è stato pubblicato sul Journal of American Statistical Association nel 1993 in Open Source software .RRR Il pacchetto rileva 5 diversi …

8
È corretto rimuovere valori anomali dai dati?
Ho cercato un modo per rimuovere valori anomali da un set di dati e ho trovato questa domanda . In alcuni dei commenti e delle risposte a questa domanda, tuttavia, le persone hanno affermato che è una cattiva pratica rimuovere i valori anomali dai dati. Nel mio set di dati …
33 outliers 



8
Sostituzione dei valori anomali con la media
Questa domanda è stata posta dal mio amico che non è esperto di Internet. Non ho un background statistico e ho cercato su Internet questa domanda. La domanda è: è possibile sostituire i valori anomali con un valore medio? se è possibile, ci sono riferimenti / riviste di libri per …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.