Ho letto in un libro di apprendimento automatico che i parametri di regressione lineare possono essere stimati (tra gli altri metodi) mediante discesa del gradiente, mentre i parametri di regressione logistica sono generalmente stimati dalla stima della massima verosimiglianza.
È possibile spiegare a un principiante (me) perché abbiamo bisogno di metodi diversi per la regressione lineare / logistica. aka perché non MLE per regressione lineare e perché non discesa gradiente per regressione logistica?