Math PhD (Programmazione non lineare) passando a Data Science?


9

Sono un dottorato in matematica. studente interessato ad andare nel settore come Data Scientist dopo la laurea. Darò brevemente alcuni retroscena della mia educazione prima di porre la mia domanda, in modo che sia meglio compreso:

Corsi di matematica:

Questo è stato principalmente in matematica pura: topologia, analisi funzionale, ecc., Ma include anche altri più applicati (sui quali mi sono specializzato per la tesi): ottimizzazione convessa, programmazione non lineare, analisi numerica, programmazione lineare, ottimizzazione multiobiettiva. Inoltre, al momento ho una conoscenza 0 della statistica inferenziale, ma sono fiducioso nella teoria della probabilità.

Programmazione:

Ho appena frequentato un corso di laurea di un anno, ma era principalmente Mathematica e Java, di cui non ricordo nulla onestamente. In questo corso, il contenuto non includeva nulla di strutture dati o progettazione e analisi di algoritmi, né sistemi di gestione di database. Ho anche imparato Matlab da solo per l'implementazione di algoritmi nella tesi di laurea.

Lo sfondo di cui sopra era durante il programma di Bachelor e Master. Ora, durante il dottorato Ho scoperto che Machine Learning è il mix perfetto (per me) tra ottimizzazione non lineare, programmazione e applicazioni nel mondo reale, ovvero teoricamente interessante e orientato alle applicazioni. Questo è il motivo per cui sono diventato così entusiasta di andare all'industria. Quindi, ho iniziato a imparare le cose da solo (nel mio piccolo tempo libero) negli ultimi 3 anni.

Breve riassunto delle cose apprese:

  • Python: mi trovo a mio agio nell'implementare algoritmi di ottimizzazione, lavoro con i quaderni jupyter e la biblioteca numpy (in effetti, dovevo farlo per la tesi), e facendo manipolazioni di dati di base e attività di pulizia in Panda. Questo l'ho imparato online, in una piattaforma chiamata dataquest ( https://app.dataquest.io ). Tuttavia, non credo di avere abbastanza conoscenze per superare un colloquio in strutture di dati e algoritmi (vedi sopra).

  • Apprendimento automatico: ho frequentato un corso di livello master sull'argomento presso l'università (da quando sono in Germania, non abbiamo corsi di dottorato, quindi è stato tutto nel mio tempo personale), cosa che mi è piaciuta molto. Argomenti inclusi: k-NN, PCA, SVM, NN, ecc.

  • Frequenta un corso di Database questo semestre, incentrato su SQL.

  • In questo semestre, specializzazione Deep Learning su Coursera.

Infine, voglio dire che mi sento totalmente in grado di apprendere gli argomenti. In effetti, con il tempo intendo frequentare più corsi di livello universitario disponibili online (ad esempio, Stanford CS231N, CS234, ecc.) Perché, a mio avviso, i corsi online potrebbero non essere abbastanza rigorosi. Spero che, dopo la difesa, sarò in grado di concentrarmi a tempo pieno su questo.

Da qui le domande:

  • Posso ancora essere assunto a questo punto (voglio dire, dopo aver terminato questo semestre con le conoscenze sopra descritte)? Onestamente penso di non essere pronto, ma sono fiducioso di poter diventare decente in un anno.

  • Sono troppo ingenuo nel pensare che un'azienda mi darebbe una possibilità?

  • Cosa devo fare per diventare più desiderabile in ogni caso?


1
Quando ho fatto domanda per il mio lavoro (in Germania) c'erano almeno due società che consideravano solo le conoscenze matematiche. Non gli importava di nient'altro. La programmazione sarebbe un favore, ma hanno programmatori dedicati per convertire le cose su cui per lo più matematici e fisici lavorano in software.
Ben

Risposte:


4

Non sono in disaccordo con le altre risposte, ma ecco una prospettiva diversa che dovresti tenere a mente. Inoltre, posso offrire risposte alle tue domande specifiche come qualcuno che ha lasciato il mondo accademico (matematica applicata / CS) per la scienza dei dati.

In breve, la comprensione delle esigenze e dei casi d'uso sottostanti a un problema aziendale è fondamentale per qualsiasi progetto, quindi lo sviluppo di un forte senso commerciale e le capacità di comunicazione interfunzionale sono fondamentali se si desidera la massima portata in una carriera di data science.

  • Posso ancora essere assunto a questo punto (voglio dire, dopo aver terminato questo semestre con le conoscenze sopra descritte)? Onestamente penso di non essere pronto, ma sono fiducioso di poter diventare decente in un anno.
  • Sono troppo ingenuo nel pensare che un'azienda mi darebbe una possibilità?

Risponderò a questi insieme. Dipende fortemente dall'azienda e dalle sue esigenze attuali. Per te, ciò può variare in base alle dimensioni da "avvio" a "impresa" e da "ML shop" a "impresa generale basata sui dati". Con quest'ultimo, intendo dire che ci sono aziende il cui unico scopo è quello di vendere prodotti o servizi ML ai clienti, rispetto alle società tecnologiche generali che vogliono sfruttare la modellizzazione nella loro attività. È probabile che troverai una soluzione più rapida / più facile con un'azienda che ha già i suoi casi d'uso ML sviluppati o dettati da altri, perché non è probabile che tu sia attrezzato per strategie per l'avvio di un nuovo progetto.

Quindi, ciò potrebbe essere vero per un'azienda più grande che ha un dipartimento dedicato alla macinazione dei tecnicismi del modello ML mentre altre parti dell'azienda determinano la strategia e il design aziendale o in un'azienda di qualsiasi dimensione che si concentra su ML come suo prodotto / servizio.

A breve termine, sì, probabilmente puoi convincere qualcuno ad averti come stagista o assistente in alcuni progetti, ma il tuo dottorato sarà probabilmente visto come un potenziale svantaggio se stai parlando con aziende medio-piccole che vogliono assumere generalisti / prese di tutti i mestieri ...

  • Cosa devo fare per diventare più desiderabile in ogni caso?

Il che mi porta a questo. Puoi scegliere la tua avventura perché ci sono così tanti tipi di ruolo, ma dovresti essere consapevole del tipo di ruolo e situazione che ogni potenziale datore di lavoro sta cercando ed essere realistico su come potresti adattarlo. Ci sono molti datori di lavoro che non esprimono chiaramente ciò di cui hanno bisogno o di cui hanno bisogno o che non sanno nemmeno di cosa si tratta . Faresti bene a capirlo con loro per evitare forti delusioni.

Se desideri ampliare i tuoi orizzonti nella scienza dei dati e assicurarti di avere il massimo impatto sul business e opportunità di sviluppo professionale, vorresti saperne di più sulle applicazioni di business della scienza dei dati. Questi sono molto diversi e sono entrambi più informali nella pratica e più influenti sull'intero business che preoccuparsi delle ottimizzazioni per le matrici pseudo-invertenti.

Nonostante le opinioni ragionevoli nelle altre risposte pubblicate sul mercato, secondo me c'è un enorme deficit di mercato per i data scientist che:

  • Comprendere perfettamente le esigenze aziendali e comunicare efficacemente con persone non tecniche
  • Sviluppare ed eseguire piani che implicano una risoluzione generale dei problemi basata sui dati, che possono o meno implicare la costruzione di modelli "fighi" (e francamente probabilmente non lo faranno, almeno non fino a quando il problema non sarà ben compreso dai metodi esplorativi più tradizionali).

risposta molto bella
pcko1

Io (nuovo laureato in matematica) credo di essere nella barca opposta come l'OP. Un po 'di programmazione lì, un po' di matematica qui, ma niente di troppo profondo da nessuna parte. La mia educazione è troppo generica, quindi è difficile distinguersi. Ho ampie competenze trasversali come hai menzionato nel tuo penultimo penultimo. Una volta compreso appieno un concetto tecnico, sono abbastanza bravo a spiegarlo ai laici. Ero anche un ufficiale della marina, quindi ho molta esperienza di lavoro con le persone e la proiezione di una "immagine", che penso attraversi in una mentalità aziendale.
rocksNwaves,

10

I lavori relativi alla scienza dei dati coprono una vasta gamma di attività diverse, pertanto è probabile che qualsiasi risposta sia soggettiva. Sono nel mondo accademico, quindi la mia conoscenza del mercato del lavoro è limitata, ma da quello che posso vedere:

  • Il contesto attuale è molto favorevole per i data scientist in cerca di lavoro, quindi chiunque abbia qualche conoscenza di base della ML ha una possibilità. Sei già sopra questo livello, quindi non preoccuparti di questo imho frontale. È probabile che la tendenza continui così, ma nessuno conosce il futuro.
  • Idealmente per aumentare le tue possibilità dovresti essere in grado di dimostrare di avere qualche esperienza pratica: ad esempio progetti github, partecipazione a un concorso ML, questo genere di cose.
  • Non trascurare il tuo dottorato in matematica: sembra che tu abbia molto tempo libero per imparare la scienza dei dati, un bene per te ... Ma assicurati che il dottorato sia la tua priorità, sarà una grande risorsa per il tuo curriculum anche se non è legato alla scienza dei dati.

3

Erwan l'ha inchiodato (+1). Ma penso che la mia aggiunta sia un po 'troppo lunga per un commento.

Sembra che tu sia molto avanti rispetto a dove ero quando ho ottenuto il mio lavoro in DS. Ero in matematica pura, un paio di post-dottor in, e ho avuto solo un breve periodo di studio personale quando stavo facendo domanda per la scienza dei dati del settore.

D'altra parte, avevo degli esami attuariali nel mio corso di laurea, che probabilmente mi hanno aiutato ad entrare nello spazio fintech. Quando si applica, enfatizzare ciò che già si conosce e riconoscere ciò che sarà necessario apprendere nei primi mesi (programmazione più forte? Utilizzando git? ...).

(Inoltre, non hai menzionato i modelli basati su alberi nel tuo corso ML: immagino che fosse solo un'omissione, ma quelli sembrano essere il modello più importante da capire a meno che tu non stia cercando di entrare in settori in cui le reti neurali sono la norma.)


Grazie per la risposta! Buono a sapersi, non è la prima volta che un puro matematico si dedica alla scienza dei dati.
John D,

Posso chiederti qual è la tua opinione sui corsi online come la specializzazione Deep Learning su Coursera? Questo tipo di corsi ti prepara davvero a lavorare nel settore?
John D,

Invece di andare a Coresera, prova i corsi veloci.ai sono più su misura per le applicazioni della vita reale, Coursera è bravo a vedere qualsiasi corso MOOC che ti insegneranno argomenti e argomenti e concetti dopo che dipende da te quanto utilizzare quegli strumenti appresi nelle applicazioni richieste. Non pensarci troppo, entra e ti assicuro che troverai la tua passione.
Khwaja Wisal,

3

Basta non prendere questo consiglio alla cieca: le materie che hai citato in matematica sono fondamentali per risolvere i problemi usando l'apprendimento automatico / Deep learning, la programmazione è uno strumento per implementare tutta questa teoria che impari e su quella base crei le tue ipotesi e poi test implementandolo nel codice per non aver bisogno di competenze di codifica di un programmatore, dovresti conoscere le strutture di dati del tuo utilizzo, in particolare i frame di dati e la manipolazione del tensore e il resto che imparerai durante l'implementazione. La parte migliore con te è che hai le conoscenze di base della matematica (suppongo che tu conosca le statistiche di probabilità calcolo multivariato, analisi funzionale e il resto delle materie che hai menzionato non entrerò nei dettagli poiché stai già facendo un dottorato di ricerca .

Ti suggerirei di seguire tutti i corsi di Fast.ai tenuti da Jeremy Howard (che è letteralmente dio dell'apprendimento profondo) il suo corso sull'apprendimento profondo pratico per programmatori è ricco di conoscenze oltre a quello per la comprensione di base della matematica dietro le reti neurali puoi andare a leggere un blog di Michael Nielsen chiamato neuralnetworksanddeeplearning.com è in realtà un libro e uno grandioso e adorerai la spiegazione matematica e per una maggiore comprensione puoi sempre andare a leggere sul blog di Chris olah è semplicemente fantastico.

Quindi ora il fatto è che puoi ancora ottenere molti stage di ricerca e andare e imparare lì in un ambiente industriale, ma preferirei suggerirti, concediti un po 'di tempo, segui questi corsi per avere una presa in mano della materia e con la matematica dietro di te, tu sono pronti a fare qualsiasi cosa. Vedi, la scienza dei dati in questo momento è come se tutti volessero essere uno e ottenere solo quel salario a 6 cifre ed essere fatto, ma non è che la scienza dei dati non sia qualcosa che puoi imparare tutto in una volta, ci vuole tempo,

Quindi, concediti del tempo, abbi pazienza e continua a risolvere continua a leggere articoli di letteratura sugli ultimi argomenti che ora sono disponibili gratuitamente ora, quindi continua.


Grazie per la risposta! andrà bene.
John D,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.