Come spiegazione alternativa, considerare la seguente intuizione:
Quando si minimizza un errore, dobbiamo decidere come penalizzare questi errori. In effetti, l'approccio più diretto alla penalizzazione degli errori sarebbe quello di utilizzare una linearly proportional
funzione di penalità. Con tale funzione, ad ogni deviazione dalla media viene dato un errore proporzionale corrispondente. Due volte più lontano dalla media si tradurrebbe quindi in una penalità doppia .
L'approccio più comune è quello di considerare una squared proportional
relazione tra deviazioni dalla media e la penalità corrispondente. Questo farà in modo che quanto più sei lontano dalla media, tanto più sarai penalizzato. Usando questa funzione di penalità, i valori anomali (lontani dalla media) sono considerati proporzionalmente più informativi delle osservazioni vicine alla media.
Per dare una visualizzazione di questo, puoi semplicemente tracciare le funzioni di penalità:
Ora soprattutto quando si considera la stima delle regressioni (ad es. OLS), diverse funzioni di penalità produrranno risultati diversi. Usando la linearly proportional
funzione penalità, la regressione assegnerà meno peso agli outlier rispetto a quando si usa la squared proportional
funzione penalità. La deviazione assoluta mediana (MAD) è quindi nota per essere uno stimatore più solido . In generale, quindi, uno stimatore robusto si adatta bene alla maggior parte dei punti dati ma "ignora" i valori anomali. Un adattamento dei minimi quadrati, in confronto, viene tirato più verso i valori anomali. Ecco una visualizzazione per il confronto:
Ora, anche se OLS è praticamente lo standard, sono sicuramente in uso anche diverse funzioni di penalità. Ad esempio, puoi dare un'occhiata alla funzione robustfit di Matlab che ti consente di scegliere una diversa funzione di penalità (chiamata anche 'peso') per la tua regressione. Le funzioni di penalità includono andrews, bisquare, cauchy, fair, huber, logistic, ols, talwar e welsch. Le loro espressioni corrispondenti sono disponibili anche sul sito Web.
Spero che ti aiuti a ottenere un po 'più di intuizione per le funzioni penali :)
Aggiornare
Se hai Matlab, posso consigliare di giocare con il robustodemo di Matlab , che è stato costruito appositamente per il confronto dei minimi quadrati ordinari con la regressione robusta:
La demo ti consente di trascinare singoli punti e vedere immediatamente l'impatto sia sui minimi quadrati ordinari sia sulla robusta regressione (che è perfetta per scopi didattici!).