La pagina di Wikipedia che cita "Gli elementi dell'apprendimento statistico" dice:
In genere, per un problema di classificazione con funzionalità , le funzioni vengono utilizzate in ogni divisione.
Capisco che si tratta di una supposizione abbastanza istruita e probabilmente è stata confermata da prove empiriche, ma ci sono altri motivi per cui si dovrebbe scegliere la radice quadrata? C'è un fenomeno statistico che sta accadendo lì?
Questo in qualche modo aiuta a ridurre la varianza degli errori?
È lo stesso per la regressione e la classificazione?