Risposte:
Ce ne sono diversi. Troverai un confronto esaustivo in questo link con una versione non controllata del documento (riferimento corretto in fondo a questa risposta).
A causa dei vincoli del problema, la suddivisione del più robusto di questi algoritmi (L / RMC) è al massimo del 12,5%. Un vantaggio di L / RMC è che si basa su quantili e rimane interpretabile anche quando la distribuzione sottostante non ha momenti. Un altro vantaggio è che non assume la simmetria della distribuzione della parte incontaminata dei dati per misurare il peso della coda: in effetti, l'algoritmo restituisce due numeri: l'RMC per il peso della coda destra e l'LMC per il peso della coda sinistra.
per costruzione: nessuna quantità di contaminazione può ad esempio causare la restituzione dell'algoritmo -1!). In pratica, si può constatare che è possibile sostituire circa il 5% del campione con valori anomali anche molto patologici senza far sì che il più colpito delle stime (ce ne siano sempre due) a discostarsi troppo dal valore che aveva sul campione non contaminato.
L / RMC è anche ampiamente implementato. Ad esempio puoi trovare un'implementazione R qui . Come spiegato nell'articolo collegato sopra, per calcolare l'L / RMC, è necessario calcolare l'MC (lo stimatore implementato nel collegamento) separatamente sulla metà sinistra e destra dei dati. Qui, la metà destra (sinistra) sono i sottocampioni formati dall'osservazione (più piccola) più grande della mediana del campione originale.