La solida PCA (sviluppata da Candes et al 2009 o meglio Netrepalli et al 2014 ) è un metodo popolare per il rilevamento di valori anomali multivariati , ma la distanza di Mahalanobis può anche essere utilizzata per il rilevamento di valori anomali, data una stima solida e regolarizzata della matrice di covarianza . Sono curioso di conoscere i (dis) vantaggi dell'utilizzo di un metodo rispetto all'altro.
La mia intuizione mi dice che la più grande distinzione tra i due è la seguente: quando il set di dati è "piccolo" (in senso statistico), la solida PCA fornirà una covarianza di livello inferiore mentre una solida stima della matrice di covarianza fornirà invece una piena grado di covarianza dovuto alla regolarizzazione del Ledoit-Wolf. In che modo ciò a sua volta influisce sul rilevamento anomalo?