L'osservazione che in un esempio che coinvolge dati ricavati da una distribuzione gaussiana contaminata, otterresti stime migliori dei parametri che descrivono la maggior parte dei dati usando invece didove è:med | x - med ( x ) | pazzo ( x )pazzomed | x - med ( x ) |pazzo ( x )
pazzo = 1.4826 × med | x - med ( x ) |
--where, è un fattore di coerenza progettato per garantire che
quando è contaminato-- è stato originariamente realizzato da Gauss (Walker, H. (1931)).E ( pazzo ( x ) 2 ) = Var ( x ) x( Φ- 1( 0,75 ) )- 1= 1.4826
E ( pazzo ( x )2) = Var ( x )
X
In questo caso non riesco a pensare a nessun motivo per non usare la invece della media di esempio. La minore efficienza (al gaussiano!) Di può essere un motivo per non usare nel tuo esempio. Tuttavia, esistono alternative altrettanto solide e altamente efficienti a . Uno di questi è ilmad mad mad Q n Q n Q nmedpazzopazzopazzoQn. Questo stimatore ha molti altri vantaggi a parte. È anche molto insensibile agli outlier (in effetti quasi insensibile come il matto). Contrariamente al matto, non è costruito attorno a una stima della posizione e non presume che la distribuzione della parte incontaminata dei dati sia simmetrica. Come il matto, si basa sulle statistiche degli ordini, in modo che sia sempre ben definito anche quando la distribuzione sottostante del campione non ha momenti. Come il matto, ha una forma esplicita semplice. Ancor più che per i matti, non vedo motivi per usare la deviazione standard del campione invece del nell'esempio che descrivi (vedi Rousseeuw e Croux 1993 per maggiori informazioni sulQnQn ).
Per quanto riguarda la tua ultima domanda, sul caso specifico in cui , quindix ∼ Γ ( ν, λ )
med ( x ) ≈ λ ( ν- 1 / 3 )
e
pazzo ( x ) ≈ λ ν--√
(in entrambi i casi le approssimazioni diventano buone quando ) in modo che ν> 1.5
ν^= ( med ( x )pazzo ( x ))2
e
λ^= pazzo ( x )2med ( x )
Vedi Chen e Rubin (1986) per una derivazione completa.
- J. Chen e H. Rubin, 1986. Rileva la differenza tra mediana e media delle distribuzioni Gamma e Poisson, Statista. Probab. Lett., 4, 281–283.
- PJ Rousseeuw e C. Croux, 1993. Alternative al Median Absolute Deviation Journal dell'American Statistical Association, vol. 88, n. 424, pagg. 1273-1283
- Walker, H. (1931). Studi nella storia del metodo statistico. Baltimora, MD: Williams & Wilkins Co. pagg. 24–25.