Domande taggate «outliers»

Un valore anomalo è un'osservazione che sembra essere insolita o non ben descritta rispetto a una semplice caratterizzazione di un set di dati. Una possibilità sconcertante è che questi dati provengano da una popolazione diversa da quella che si intende studiare.

4
Rilevamento di valori anomali mediante deviazioni standard
Seguendo la mia domanda qui , mi chiedo se ci sono punti di vista forti a favore o contro l'uso della deviazione standard per rilevare valori anomali (ad es. Qualsiasi punto dati che è più di 2 deviazione standard è un valore anomalo). So che questo dipende dal contesto dello …
27 outliers 


4
Perché il RANSAC non è più utilizzato nelle statistiche?
Provenendo dal campo della visione artificiale, ho spesso usato il metodo RANSAC (Random Sample Consensus) per adattare i modelli ai dati con molti valori anomali. Tuttavia, non l'ho mai visto usato dagli statistici e ho sempre avuto l'impressione che non fosse considerato un metodo "statisticamente valido". Perchè è così? È …

3
Applicazione di wavelet agli algoritmi di rilevazione delle anomalie basati su serie temporali
Ho iniziato a lavorare attraverso i tutorial statistici sull'estrazione dei dati di Andrew Moore (altamente raccomandato a chiunque si avventura per la prima volta in questo campo). Ho iniziato leggendo questo PDF estremamente interessante intitolato "Panoramica introduttiva degli algoritmi di rilevamento delle anomalie basati su serie temporali" in cui Moore …





1
Rilevamento di valori anomali nei dati di conteggio
Ho quello che pensavo ingenuamente di essere un problema piuttosto semplice che comporta il rilevamento anomalo di molti diversi set di dati di conteggio. In particolare, voglio determinare se uno o più valori in una serie di dati di conteggio sono più alti o più bassi del previsto rispetto al …

2
Bootstrap: devo prima rimuovere gli outlier?
Abbiamo eseguito un split test di una nuova funzionalità di prodotto e vogliamo misurare se l'aumento delle entrate è significativo. Le nostre osservazioni sicuramente non sono normalmente distribuite (la maggior parte dei nostri utenti non spende, e all'interno di quelle che lo fanno, è fortemente distorta nei confronti di molti …

3
Come valutare l'asimmetria da un diagramma a scatole?
Come decidere l'asimmetria guardando un diagramma a scatole costruito da questi dati: 340, 300, 520, 340, 320, 290, 260, 330 Un libro dice: "Se il quartile inferiore è più lontano dalla mediana rispetto al quartile superiore, la distribuzione è distorta negativamente". Diverse altre fonti hanno detto più o meno lo …

2
Rilevazione di anomalie con funzionalità fittizie (e altre funzionalità discrete / categoriche)
tl; dr Qual è il modo consigliato di trattare i discretedati quando si esegue il rilevamento di anomalie? Qual è il modo consigliato di trattare i categoricaldati quando si esegue il rilevamento di anomalie? Questa risposta suggerisce l'utilizzo di dati discreti per filtrare i risultati. Sostituisci forse il valore della …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.