Domande taggate «outliers»

Un valore anomalo è un'osservazione che sembra essere insolita o non ben descritta rispetto a una semplice caratterizzazione di un set di dati. Una possibilità sconcertante è che questi dati provengano da una popolazione diversa da quella che si intende studiare.

1
Come tenere conto dell'impatto delle vacanze nelle previsioni
Ho una serie temporale giornaliera abbastanza prevedibile con stagionalità settimanale. Sono in grado di elaborare previsioni che sembrano essere abbastanza precise (confermate dalla convalida incrociata) quando non ci sono festività. Tuttavia, quando ci sono festività, ho i seguenti problemi: Ricevo numeri diversi da zero per le festività nelle mie previsioni, …


4
Buona forma per rimuovere gli outlier?
Sto lavorando su statistiche per build di software. Ho i dati per ogni build su pass / fail e tempo trascorso e ne generiamo ~ 200 di questi / settimana. Il tasso di successo è facile da aggregare, posso dire che il 45% ha superato una determinata settimana. Ma vorrei …


1
Differenze tra PROC Mixed e lme / lmer in R - gradi di libertà
Nota: questa domanda è una risposta, poiché la mia domanda precedente doveva essere cancellata per motivi legali. Confrontando PROC MIXED da SAS con la funzione lmedel nlmepacchetto in R, mi sono imbattuto in alcune differenze piuttosto confuse. Più specificamente, i gradi di libertà nei diversi test differiscono tra PROC MIXEDe …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
Rilevamento anomalo in set molto piccoli
Devo ottenere un valore il più preciso possibile per la luminosità di una fonte di luce principalmente stabile, dati dodici valori di luminosità del campione. Il sensore è imperfetto e la luce può occasionalmente "sfarfallare" più luminosa o più scura, che può essere ignorata, quindi la mia necessità di un …


1
Stima robusta della curtosi?
Sto usando il consueto stimatore per la , ma mi accorgo che anche piccole 'valori anomali' nella mia distribuzione empirica, cioè piccoli picchi lontano dal centro, incidono su di esso tremendamente. Esiste uno stimatore della curtosi che è più robusto?K^= μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
Modelli misti lineari generalizzati: diagnostica
Ho una regressione logistica di intercettazione casuale (dovuta a misurazioni ripetute) e vorrei fare un po 'di diagnostica, in particolare riguardo a valori anomali e osservazioni influenti. Ho guardato i residui per vedere se ci sono osservazioni che si distinguono. Ma vorrei anche guardare qualcosa come la distanza di Cook …

2
Quanto è preciso l'IQR per rilevare i valori anomali
Sto scrivendo una sceneggiatura che analizza i tempi di esecuzione dei processi. Non sono sicuro della loro distribuzione, ma voglio sapere se un processo dura "troppo a lungo". Finora ho usato 3 deviazioni standard degli ultimi tempi di esecuzione (n> 30), ma mi è stato detto che questo non fornisce …


3
Trovare il punto GPS medio
Devo scrivere un programma per trovare il punto GPS medio da una popolazione di punti. In pratica succede quanto segue: Ogni mese una persona registra un punto GPS della stessa risorsa statica. A causa della natura del GPS, questi punti differiscono leggermente ogni mese. A volte la persona commette un …
11 outliers  spatial 

2
Rilevamento anomalo mediante regressione
La regressione può essere utilizzata per il rilevamento di lier out. Capisco che ci sono modi per migliorare un modello di regressione rimuovendo gli outlier. Ma l'obiettivo principale qui non è quello di adattarsi a un modello di regressione, ma scoprire le bugie usando la regressione



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.