Domande taggate «outliers»

Un valore anomalo è un'osservazione che sembra essere insolita o non ben descritta rispetto a una semplice caratterizzazione di un set di dati. Una possibilità sconcertante è che questi dati provengano da una popolazione diversa da quella che si intende studiare.




3
Rilevamento anomalo affidabile in periodi finanziari
Sto cercando alcune tecniche robuste per rimuovere valori anomali ed errori (qualunque sia la causa) dai dati finanziari delle serie temporali (ad esempio tickdata). I dati delle serie temporali tick-by-tick sono molto confusi. Contiene enormi lacune (temporali) quando lo scambio è chiuso e fa enormi salti quando lo scambio si …

5
È barare eliminare i valori anomali in base al diagramma a scatole di Errore assoluto medio per migliorare un modello di regressione
Ho un modello di previsione testato con quattro metodi, come puoi vedere nella figura del diagramma a scatole di seguito. L'attributo previsto dal modello è compreso nell'intervallo 0-8. È possibile notare che sono presenti un valore anomalo superiore e tre valori anomali inferiori indicati da tutti i metodi. Mi chiedo …



3
Corso di crash nella stima media robusta
Ho un sacco (circa 1000) di stime e si suppone che siano tutte stime di elasticità a lungo termine. Poco più della metà di questi viene stimata usando il metodo A e il resto usando un metodo B. Da qualche parte leggo qualcosa del tipo "Penso che il metodo B …


5
Esiste un modo semplice per rilevare i valori anomali?
Mi chiedo se esiste un modo semplice per rilevare i valori anomali. Per uno dei miei progetti, che era fondamentalmente una correlazione tra il numero di volte in cui gli intervistati partecipano all'attività fisica in una settimana e il numero di volte in cui mangiano fuori casa (fast food) in …

1
Cadere valori anomali basati su "2,5 volte il RMSE"
In Kahneman and Deaton (2010) † , gli autori scrivono quanto segue:††^\dagger Questa regressione spiega il 37% della varianza, con un errore quadratico medio radice (RMSE) di 0,67852. Per eliminare i valori anomali e i rapporti sul reddito non plausibili, abbiamo eliminato le osservazioni in cui il valore assoluto della …



1
LARS vs discesa delle coordinate per il lazo
Quali sono i pro e i contro dell'utilizzo di LARS [1] rispetto all'utilizzo della discesa delle coordinate per l'adattamento della regressione lineare regolarizzata L1? Sono principalmente interessato agli aspetti prestazionali (i miei problemi tendono ad avere Ntra le centinaia di migliaia e p<20). Tuttavia, anche altre intuizioni sarebbero apprezzate. modifica: …

4
Separare due popolazioni dal campione
Sto cercando di separare due gruppi di valori da un singolo set di dati. Posso presumere che una delle popolazioni sia normalmente distribuita e abbia almeno la metà della dimensione del campione. I valori del secondo sono entrambi inferiori o superiori ai valori del primo (la distribuzione è sconosciuta). Quello …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.