Quindi in una distribuzione normale, abbiamo due parametri: mean e variance . Nel libro Pattern Recognition and Machine Learning , appare improvvisamente un iperparametro nei termini di regolarizzazione della funzione di errore.
Cosa sono gli iperparametri? Perché sono nominati come tali? E in che modo sono intuitivamente diversi dai parametri in generale?