Il modo in cui lo guardo è che le statistiche / l'apprendimento automatico ti dicono cosa dovresti ottimizzare e l'ottimizzazione è come lo fai realmente.
Ad esempio, si consideri la regressione lineare con dove E ( ε ) = 0 e V a r ( ε ) = σ 2 I . Le statistiche ci dice che questo è (spesso) un modello di buona, ma abbiamo trovato la nostra stima attuale β risolvendo un problema di ottimizzazioneY= Xβ+ εE( ε ) = 0Va r ( ε ) = σ2ioβ^
β^= argminb ∈ Rp| |Y- Xb | |2.
Le proprietà di β sono noti a noi attraverso le statistiche in modo sappiamo che questo è un buon problema di ottimizzazione da risolvere. In questo caso si tratta di una facile ottimizzazione ma questo mostra ancora il principio generale.β^
Più in generale, gran parte di machine learning può essere visto come risolvere
f = argmin f ∈ F 1
dove sto scrivendo questo senza regolarizzazione ma che potrebbe essere facilmente aggiunto.
f^= argminf∈ F1nΣi = 1nL ( yio, f( xio) )
Un'enorme quantità di ricerche nella teoria dell'apprendimento statistico (SLT) ha studiato le proprietà di questi argminima, indipendentemente dal fatto che siano asintoticamente ottimali, in che modo si relazionano con la complessità di e molte altre cose del genere. Ma quando si vuole realmente ottenere f , spesso si finisce con un'ottimizzazione difficile ed è tutta una serie separata di persone che studiano il problema. Penso che la storia di SVM sia un buon esempio qui. Abbiamo le persone SLT come Vapnik e Cortes (e molte altre) che hanno dimostrato come SVM sia un buon problema di ottimizzazione da risolvere. Ma poi furono altri come John Platt e gli autori di LIBSVM a renderlo possibile nella pratica.Ff^
Per rispondere alla tua domanda esatta, conoscere qualche ottimizzazione è sicuramente utile, ma generalmente nessuno è un esperto in tutte queste aree, quindi impari il più possibile, ma alcuni aspetti saranno sempre una sorta di scatola nera per te. Forse non hai studiato correttamente i risultati SLT alla base del tuo algoritmo ML preferito, o forse non conosci il funzionamento interno dell'ottimizzatore che stai utilizzando. È un viaggio che dura tutta la vita.