Cos'è la correzione del bias? [chiuso]


12

Ho visto molti posti in cui hanno set di dati di input / output in cui prima creano una linea di regressione lineare, correggono il bias e quindi usano solo quei dati per il loro modello. Non ho capito cos'è questa correzione del bias?


6
Penso che potresti dover fornire un riferimento o un esempio esplicito in modo che possiamo sapere esattamente a cosa stai reagendo.
whuber

@ naught101, ti preghiamo di fare alcuni alla volta, non fare spam sulla pagina principale.
gung - Ripristina Monica

@gung: ah .. vuoi dire qualche tag e poi aspettare un po '? Spiacente troppo tardi. Ne ho trovati solo una decina e li ho fatti tutti. Dimenticato l'effetto della prima pagina: / Se solo SE avesse una bella funzione di etichettatura di massa.
nulla101

@gung: Forse oggi può essere il giorno inaugurale della correzione del bias: D
naught101

1
@ naught101 la ricodifica unilaterale di massa è un po 'un no-no, specialmente su un tag appena creato. In linea di massima è meglio impegnarsi su meta ove possibile (per spiegare ciò che si intende), e se sembra non controverso, quindi fare un po 'di ricodifica, ma solo pochi alla volta.
Glen_b -Restate Monica

Risposte:


11

Sebbene l'affermazione del problema non sia abbastanza precisa per sapere esattamente a quale tipo di correzione del bias ti riferisci, penso di poterne parlare in termini generali. A volte uno stimatore può essere distorto. Ciò significa semplicemente che sebbene possa essere un buon stimatore, il suo valore atteso o medio non è esattamente uguale al parametro. La differenza tra la media dello stimatore e il valore del parametro vero è chiamata distorsione. Quando è noto che uno stimatore è distorto, a volte è possibile, con altri mezzi, stimare la distorsione e quindi modificare lo stimatore sottraendo la distorsione stimata dalla stima originale. Questa procedura è chiamata correzione del bias. Viene fatto con l'intento di migliorare la stima. Mentre ridurrà la distorsione, aumenterà anche la varianza.

Un buon esempio di corretta correzione della distorsione è la stima della correzione della distorsione da bootstrap del tasso di errore di classificazione. La stima di reintegrazione del tasso di errore ha un grande pregiudizio ottimistico quando la dimensione del campione è piccola. Il bootstrap viene utilizzato per stimare il bias della stima di resubstitution e poiché la stima di resubstitution sottostima il tasso di errore, la stima di bias viene aggiunta alla stima di resubstitution per ottenere la stima del bias bootstrap corretta del tasso di errore. Quando la dimensione del campione è piccola 30 o meno, combinando entrambe le classi in un problema a due classi alcune forme della stima bootstrap (in particolare la stima 632) forniscono stime più accurate dei tassi di errore rispetto alla validazione incrociata one-out (che è molto stima quasi imparziale del tasso di errore).


1
"Mentre ridurrà il pregiudizio, aumenterà anche la varianza." - puoi spiegarlo un po 'di più? Non dipende dal metodo? Intendi in sostanza che ridurre il bias di una regressione lineare ottimale RMSE aumenterà necessariamente l'RMSE o è qualcos'altro?
naught101
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.