durante un corso online sull'apprendimento automatico di Andrew Ng in corso, mi sono imbattuto in un argomento chiamato overfitting . So che può verificarsi quando la discesa del gradiente viene utilizzata nella regressione lineare o logistica, ma può verificarsi quando vengono utilizzati algoritmi di ottimizzazione avanzata come "gradiente coniugato", "BFGS" e "L-BFGS"?