In 'Gli elementi di apprendimento statistico', l'espressione di bias-varianza decomposizione lineare modello figura come dove è la funzione target effettiva,
Il termine varianza mi preoccupa qui perché l'equazione implica che la varianza sarebbe zero se gli obiettivi fossero silenziosi, cioèMa non ha senso per me perché anche con zero noise posso ancora ottenere diversi stimatori per diversi set di allenamento che implica che la varianza è diversa da zero.
Ad esempio, supponiamo che la funzione target sia quadratica e che i dati di allenamento contengano due punti campionati a caso da questa quadratica; chiaramente, otterrò un diverso adattamento lineare ogni volta che campionerò due punti in modo casuale dal bersaglio quadratico. Allora come può la varianza essere zero?
Qualcuno può aiutarmi a scoprire cosa c'è che non va nella mia comprensione della decomposizione della bias-varianza?