Stima robusta della curtosi?

Sto usando il consueto stimatore per la , ma mi accorgo che anche piccole 'valori anomali' nella mia distribuzione empirica, cioè piccoli picchi lontano dal centro, incidono su di esso tremendamente. Esiste uno stimatore della curtosi che è più robusto?

\hat{K} = \frac{{\hat{μ}}_{4}}{{\hat{σ}}^{4}}

$\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}$

— Yoki
fonte

Ce ne sono diversi. Troverai un confronto esaustivo in questo link con una versione non controllata del documento (riferimento corretto in fondo a questa risposta).

A causa dei vincoli del problema, la suddivisione del più robusto di questi algoritmi (L / RMC) è al massimo del 12,5%. Un vantaggio di L / RMC è che si basa su quantili e rimane interpretabile anche quando la distribuzione sottostante non ha momenti. Un altro vantaggio è che non assume la simmetria della distribuzione della parte incontaminata dei dati per misurare il peso della coda: in effetti, l'algoritmo restituisce due numeri: l'RMC per il peso della coda destra e l'LMC per il peso della coda sinistra.

$[0,1]$ per costruzione: nessuna quantità di contaminazione può ad esempio causare la restituzione dell'algoritmo -1!). In pratica, si può constatare che è possibile sostituire circa il 5% del campione con valori anomali anche molto patologici senza far sì che il più colpito delle stime (ce ne siano sempre due) a discostarsi troppo dal valore che aveva sul campione non contaminato.

L / RMC è anche ampiamente implementato. Ad esempio puoi trovare un'implementazione R qui . Come spiegato nell'articolo collegato sopra, per calcolare l'L / RMC, è necessario calcolare l'MC (lo stimatore implementato nel collegamento) separatamente sulla metà sinistra e destra dei dati. Qui, la metà destra (sinistra) sono i sottocampioni formati dall'osservazione (più piccola) più grande della mediana del campione originale.

Brys, Hubert, Struyf. (2006). Misure robuste del peso della coda.

— user603
fonte

Queste misure alternative di peso della coda piuttosto che robusti stimatori di curtosi per dire? Questo potrebbe essere quello che vuole davvero. ma non è esattamente quello che ha chiesto. Qualcuno / tutti questi stimatori convergono in curtosi per campioni di grandi dimensioni?

— AndrewH

Sintesi del documento: a dati incontaminati che soddisfano le condizioni relative all'ordinamento convesso di Van Zwet (in base al quale la misura della curtosi è significativa) convergono in una funzione monotona della curtosi.

— user603

La curtosi di Pearson misura valori anomali (rare osservazioni estreme), chiari e semplici. Allora cosa stai cercando? Una misura di "picco"? In primo luogo, questo non è affatto ciò che misura la curtosi di Pearson. In secondo luogo, se si desidera una misura di "picco", è necessario innanzitutto definire cosa significa. Se puoi definirlo, puoi stimarlo. Una possibilità è la seconda derivata del pdf dei dati standardizzati, valutata al picco. (Prego). Sono sicuro che ce ne sono altri.

— Peter Westfall,

In realtà, do tre teoremi matematici che mettono in relazione la curtosi con le code della distribuzione, quindi questi non possono essere falsificati: (i) Per tutte le distribuzioni con quarto momento finito, la curtosi è compresa tra E (Z ^ 4 * I (| Z |> 1 )) e E (Z ^ 4 * I (| Z |> 1)) +1. (ii) Nella sottoclasse per la quale la densità di Z ^ 2 è continua e decrescente di (0,1), "+1" può essere sostituito da "+.5". (iii) Per qualsiasi sequenza di distribuzioni con kurtosi -> infinito, E (Z ^ 4 * I (| Z |> b)) / kurtosi -> 1, per qualsiasi reale b. È tutto qui: ncbi.nlm.nih.gov/pmc/articles/PMC4321753

— Peter Westfall,