Buona domanda. In realtà c'è molta confusione su questo argomento, principalmente perché entrambi sono lavori piuttosto nuovi. Ma se ci concentriamo sulla semantica, il vero significato dei lavori diventa chiaro.
Prima è meglio confrontare le mele con le mele, parlando di un singolo argomento, i Dati. Machine Learning e il suo sottogenere (Deep Learning, ecc.) Sono solo un aspetto del Data World, insieme alle teorie statistiche, all'acquisizione dei dati (DAQ), all'elaborazione (che può essere guidata dall'apprendimento automatico), il interpretazione dei risultati, ecc.
Quindi, per la mia spiegazione, estenderò il ruolo di Engine Learning Engineer a quello di Data Engineer.
La scienza riguarda esperimenti, prove e fallimenti, costruzione della teoria, comprensione fenomenologica. L'ingegneria riguarda il lavoro su ciò che la scienza già conosce, perfezionandolo e portandolo nel "mondo reale".
Pensa a un proxy: qual è la differenza tra uno scienziato nucleare e un ingegnere nucleare?
Lo scienziato nucleare è quello che conosce la scienza dietro l'atomo, l'interazione tra loro, quella che ha scritto la ricetta che consente di ottenere energia dagli atomi.
L'ingegnere nucleare è il ragazzo incaricato di prendere la ricetta dello scienziato e portarla nel mondo reale. Quindi la sua conoscenza della fisica atomica è piuttosto limitata, ma conosce anche materiali, edifici, economia e qualsiasi altra cosa utile per costruire una vera centrale nucleare.
Tornando al mondo dei dati, ecco un altro esempio: i ragazzi che hanno sviluppato Convolutional Neural Networks (Yann LeCun) è un Data Scientist, il ragazzo che implementa il modello per riconoscere i volti nelle immagini è un Machine Learning Engineer. Il responsabile dell'intero processo, dall'acquisizione dei dati alla registrazione dell'immagine .JPG, è un tecnico dei dati.
Quindi, in pratica, il 90% dei Data Scientist oggi è in realtà Data Engineer o Machine Learning Engineer e il 90% delle posizioni aperte come Data Scientist ha effettivamente bisogno di Engineer. Un semplice controllo: nell'intervista, ti verrà chiesto su quanti modelli ML hai distribuito in produzione, non su quanti documenti sui nuovi metodi hai pubblicato.
Invece, quando vedi annunci su "Machine Learning Engineer", ciò significa che i recruiter sono ben consapevoli della differenza e hanno davvero bisogno di qualcuno in grado di mettere in produzione un modello.
Data scientist
sembra una designazione con poca chiarezza su quale sarà il lavoro effettivo, mentremachine learning engineer
è più specifico. Nel primo caso, la tua azienda ti fornirà un obiettivo e dovrai capire quale approccio (apprendimento automatico, elaborazione delle immagini, rete neurale, logica fuzzy, ecc.) Utilizzeresti. Nel secondo caso, la tua azienda si è già limitata a quale approccio deve essere utilizzato.