Esiste una rappresentazione grafica del compromesso di bias varianza nella regressione lineare?


18

Sto soffrendo di un blackout. Mi è stata presentata la seguente immagine per mostrare il compromesso della variazione di bias nel contesto della regressione lineare:

Modello polinomiale per dati, caso semplice e complesso

Vedo che nessuno dei due modelli è adatto: il "semplice" non sta apprezzando la complessità della relazione XY e il "complesso" si sta semplicemente adattando, fondamentalmente imparando a memoria i dati di allenamento. Tuttavia non riesco completamente a vedere il pregiudizio e la varianza in queste due immagini. Qualcuno potrebbe mostrarmelo?

PS: La risposta alla spiegazione intuitiva del compromesso di bias-varianza? non mi ha davvero aiutato, sarei felice se qualcuno potesse fornire un approccio diverso basato sull'immagine sopra.

Risposte:


11

Il compromesso della variazione di polarizzazione si basa sulla suddivisione dell'errore quadratico medio:

MSE(y^)=E[yy^]2=E[yE[y^]]2+E[y^E[y^]]2

Un modo per vedere il commercio di bias varianza è quali proprietà del set di dati vengono utilizzate nell'adattamento del modello. Per il modello semplice, se assumiamo che la regressione OLS sia stata usata per adattarsi alla linea retta, allora solo 4 numeri sono usati per adattarsi alla linea:

  1. La covarianza del campione tra xe y
  2. La varianza del campione di x
  3. La media campionaria di x
  4. La media campionaria di y

Quindi, qualsiasi grafico che porta agli stessi 4 numeri sopra porterà esattamente alla stessa linea adattata (10 punti, 100 punti, 100000000 punti). Quindi, in un certo senso, è insensibile al particolare campione osservato. Ciò significa che sarà "distorto" perché ignora efficacemente parte dei dati. Se quella parte ignorata dei dati risulta essere importante, le previsioni saranno costantemente in errore. Questo verrà visualizzato se si confronta la linea adattata utilizzando tutti i dati con le linee adattate ottenute rimuovendo un punto dati. Tenderanno ad essere abbastanza stabili.

Ora il secondo modello utilizza ogni frammento di dati che può ottenere e si adatta ai dati il ​​più vicino possibile. Quindi, la posizione esatta di ogni punto di dati è importante e quindi non è possibile spostare i dati di allenamento senza cambiare il modello adattato come è possibile per OLS. Quindi il modello è molto sensibile al particolare set di allenamento che hai. Il modello montato sarà molto diverso se si esegue la stessa trama del punto dati drop-one.


θ^y^θx,y

y^θ^

θ^bias(θ^)=θE[θ^]θf(x)=a+bx+cx2h(x)=d+ex(a,b,c)(d,e)bias(d)bias(e)

@loganecolss - questo non è un paradosso in quanto la nozione di distorsione esiste solo "localmente" - cioè rispetto ad un dato modello statistico. Il "paradosso" esiste per una persona che: 1) conosce il "vero modello" e 2) decide di non usarlo. Quella persona è un idiota nel mio libro. Se non si conosce il "vero modello" allora non è un problema - a meno che non avete trovato un buon modello e ha deciso di non usarlo ...
probabilityislogic

1
f(x,z1,z2,,zK)ziK
Probislogic il

5

Riassumendo con ciò che penso di sapere in modo non matematico:

  • bias: la previsione sarà errata quando si utilizza il modello semplice e ciò accadrà su qualsiasi set di dati su cui si utilizza il modello. La tua previsione dovrebbe essere sbagliata
  • varianza: se si utilizza il modello complesso, si otterrà una previsione molto diversa in base al set di dati che si sta utilizzando

Questa pagina ha una spiegazione abbastanza buona con diagrammi simili a quelli che hai pubblicato. (Ho saltato la parte superiore però, ho appena letto la parte con i diagrammi) http://www.aiaccess.net/English/Glossaries/GlosMod/e_gm_bias_variance.htm (il passaggio del mouse mostra un campione diverso nel caso in cui non te ne fossi accorto!)


Questa è una pagina interessante e buone illustrazioni, ma le trovo più confuse che utili perché (a) il "pregiudizio" e la "varianza" discussi nel contesto della regressione non sembrano essere il pregiudizio e la varianza come definiti all'inizio pagina e (b) non è affatto chiaro che le dichiarazioni fatte (su come il bias e la varianza cambiano con il numero di parametri) siano corrette.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.