Faccio fatica a capire la derivazione dell'errore di predizione previsto per sotto (ESL), in particolare sulla derivazione di 2.11 e 2.12 (condizionamento, il passo verso il minimo puntuale). Eventuali puntatori o link molto apprezzati.
Di seguito sto riportando l'estratto di ESL pag. 18. Le prime due equazioni sono, in ordine, l'equazione 2.11 e 2.12.
Consenti a indicare un vettore di input casuale con valori reali e una variabile di output casuale con valori reali, con distribuzione congiunta . Cerchiamo una funzione per predire dati valori di ingresso . Questa teoria richiede una funzione di perdita per penalizzare gli errori di predizione, e di gran lunga la più comune e conveniente è la perdita di errori al quadrato : . Questo ci conduce a un criterio per la scelta di ,
l'errore di previsione previsto (al quadrato). Condizionando su , possiamo scrivere EPE come
e vediamo che è sufficiente ridurre al minimo EPE:
La soluzione è
l'attesa condizionale, nota anche come funzione di regressione .