Cosa ne pensi delle certificazioni di Data Science?


35

Ora ho visto due programmi di certificazione della scienza dei dati: quello di John Hopkins disponibile a Coursera e quello di Cloudera .

Sono sicuro che ce ne sono altri là fuori.

L'insieme di classi di John Hopkins si concentra su R come set di strumenti, ma copre una vasta gamma di argomenti:

  • R Programmazione
  • pulizia e acquisizione dei dati
  • Analisi dei dati
  • Ricerca riproducibile
  • Inferenza statistica
  • Modelli di regressione
  • Apprendimento automatico
  • Sviluppo di prodotti dati
  • E quello che sembra essere un compito di completamento basato sul Progetto simile alla Data Science Challenge di Cloudera

Il programma Cloudera sembra sottile in superficie, ma cerca di rispondere a due importanti domande: "Conosci gli strumenti", "Puoi applicare gli strumenti nel mondo reale". Il loro programma consiste in:

  • Introduzione alla scienza dei dati
  • Esame di Data Science Essentials
  • Data Science Challenge (uno scenario di progetto di scienza dei dati del mondo reale)

Non sto cercando una raccomandazione su un programma o un confronto di qualità.

Sono curioso di conoscere altre certificazioni là fuori, gli argomenti che trattano e quanto seriamente le certificazioni DS vengano visualizzate a questo punto dalla community.

EDIT: Queste sono tutte ottime risposte. Sto scegliendo la risposta corretta con i voti.


4
Questo è troppo ampio e principalmente basato sull'opinione pubblica. Dai
asheeshr,

3
@AsheeshR: calcoliamo in media 2 domande al giorno e 2 risposte per domanda. A questo punto l'attenzione deve essere focalizzata sull'incoraggiamento della partecipazione e sul crescente interesse.
Steve Kallestad,

10
L'impegno a scapito della qualità del sito non è la soluzione. L'impegno è temporaneo. La qualità è molto più difficile da modificare in seguito.
asheeshr,

4
Biciclette , Il posto di lavoro , Finanza personale e denaro , Scettici , Sviluppo di giochi tutti lanciati con meno di 10 domande al giorno. Le biciclette sono state lanciate con 4 al giorno perché considerato un sito di alta qualità.
asheeshr,

3
Beh ... immagino di doverti dichiarare il vincitore a questo punto. :)
Steve Kallestad,

Risposte:


13

Ho fatto i primi 2 corsi e sto programmando di fare anche tutti gli altri. Se non conosci R, è davvero un buon programma. Ci sono incarichi e quiz ogni settimana. Molte persone trovano alcuni corsi molto difficili. Avrai difficoltà se non hai esperienza di programmazione (anche se dicono che non è necessario).

Ricorda solo .. non è perché puoi guidare una macchina che sei un pilota di F1;)


32

Come ex responsabile dell'analisi e attuale scienziato capo dei dati, sono molto diffidente verso la necessità di certificati per la scienza dei dati. Il termine scienziato dei dati è piuttosto vago e il campo della scienza dei dati è agli inizi. Un certificato implica una sorta di standard uniforme che manca solo nella scienza dei dati, è ancora molto il selvaggio west.

Mentre un certificato probabilmente non ti farà del male, penso che sarebbe meglio trascorrere il tuo tempo a sviluppare l'esperienza per sapere quando utilizzare un determinato approccio e la profondità di comprensione per essere in grado di spiegare tale approccio a un pubblico non tecnico.


2
A volte è difficile acquisire esperienza se il tuo lavoro attuale non è focalizzato sulla scienza dei dati ma su un campo correlato (nel mio caso le statistiche). Uso i corsi per acquisire alcune conoscenze e rimanere sull'argomento, cosa che non posso fare nel mio lavoro diurno.
Christian Sauer,

1
Sono pienamente d'accordo, i corsi sono molto preziosi per darti un punto di partenza e una struttura per acquisire questa esperienza. Per ottenere il massimo dal Mooc, suggerisco di fare un esempio molto specifico, diciamo la regressione logistica, e di lavorarci davvero con un set di dati diverso, doppio bonus se lo fai in una lingua diversa da quella in cui viene insegnato il corso .
neone4373

Questa è una buona idea. Ciò che manca per le statistiche in generale è un sito Web di formazione. Ad esempio un set di database, insieme a obiettivi e possibili risultati alla fine. Qualcosa come khancademy, ma più potente;)
Christian Sauer,

11

I programmi di certificazione che hai citato sono in realtà corsi di base. Personalmente, penso che questi certificati mostrino solo la persistenza delle persone e possano essere utili solo a coloro che si candidano per uno stage, non ai veri lavori di data science.


Sono d'accordo. Il materiale del corso è utile per iniziare, ma è principalmente di livello base.
Shagun Sodhani,

10

Dirigo team di data science per un'importante azienda Internet e ho selezionato centinaia di profili e intervistato dozzine per i nostri team in tutto il mondo. Molti candidati hanno superato i suddetti corsi e programmi o presentano credenziali simili. Personalmente, ho anche seguito i corsi, alcuni sono buoni, altri sono deludenti, ma nessuno di loro ti rende uno "scienziato dei dati".

In generale, sono d'accordo con gli altri qui. Un certificato di Coursera o Cloudera segnala solo un interesse ma non sposta l'ago. C'è molto altro da considerare e puoi avere un impatto maggiore fornendo un repository completo del tuo lavoro (ad esempio il profilo github) e collegandoti in rete con altri data scientist. Chiunque assuma per un profilo di data science preferirà sempre vedere il tuo lavoro precedente e lo stile / le abilità di codifica.


8

Esistono più certificazioni in corso, ma hanno un'area di interesse e uno stile di insegnamento diversi.

Preferisco The Edge Edge su eDX molto di più rispetto alla specializzazione John Hopkins, in quanto è più intenso e pratico. L'aspettativa nella specializzazione John Hopkins è di inserire 3-4 ore alla settimana contro 11-12 ore alla settimana su Analytics Edge.

Dal punto di vista del settore, prendo queste certificazioni come un segno di interesse e non livello di conoscenza che una persona possiede. Ci sono troppi abbandoni in questi MOOC. Apprezzo altre esperienze (come la partecipazione alle competizioni Kaggle) molto più che sottoporsi alla certificazione XYZ su MOOC.


2
E che dire dei profili stats.SE, datascience.SE. Pensi che possano dire molto sul livello rilevante di conoscenza?
IharS,

Che cosa hanno a che fare gli abbandoni? Presumibilmente, la certificazione dipende dal completamento del corso, non dalla semplice registrazione ...
Gala

Ci sono molte persone che affermano di essere in fase di certificazione seguendo un corso su questi MOOC. Devi stare attento con quello.
Kunal,

@Kunal Ha senso, ma la tua risposta passa da "certificazione" a "abbandoni" (che presumibilmente non hanno una certificazione ). La chiave qui è in corso . È un po 'come essere registrato come studente o avere un account Kaggle. Niente di tutto ciò ci dice se dovresti valutare qualcuno che ha effettivamente conseguito una laurea, completare un corso o partecipare a un concorso fino alla fine.
Gala,

6

Non sono sicuro dell'era della nuvola, ma uno dei miei amici si è unito a quello di John Hopkins e nelle sue parole è "geniale iniziare". È stato anche raccomandato da molte persone. Sto programmando di unirmi tra qualche settimana. Per quanto riguarda la serietà, non credo che queste certificazioni ti aiuteranno a trovare un lavoro, ma sicuramente ti aiuteranno ad imparare.


4

@OP: Scegliere le risposte con i voti è la peggiore idea.

La tua domanda diventa un concorso di popolarità. Dovresti cercare la risposta giusta, dubito che tu sappia cosa stai chiedendo, sapere cosa stai cercando.

Per rispondere alla tua domanda:
D: quanto seriamente le certificazioni DS vengono visualizzate a questo punto dalla community.

A: Qual è il tuo obiettivo da seguire questi corsi? Per lavoro, per scuola, per auto-miglioramento, ecc.? Le lezioni di Coursera sono molto applicate, non imparerai molte teorie, sono intenzionalmente riservate alla classe.

Tuttavia, le lezioni di Coursera sono molto utili. Direi che equivale a un anno di lezione statistica, su un programma di Master biennale.

Non sono ancora sicuro del suo riconoscimento nel settore, perché il problema di come hai seguito il corso? Quanto tempo hai trascorso? È molto più facile ottenere A in questi corsi rispetto a un esame di carta a matita. Quindi, c'è una grande variazione di qualità da persona a persona.


Parte della domanda ha lo scopo di valutare se la comunità abbia o meno attribuito valore alla certificazione. In alcune aree, la certificazione è una necessità assoluta. In altri, la certificazione non ha alcuna importanza. In altri ancora, le certificazioni di una determinata azienda sono tenute in grande considerazione e le certificazioni competitive non lo sono. L'altra parte aveva lo scopo di comprendere la differenza nel focus topico delle certificazioni che sono là fuori. Data Science è un termine ampio. Le certificazioni sono normalmente più mirate. Questa è una brutta domanda per il formato QA: è più una discussione, soggetta ad opinione.
Steve Kallestad,

Il mio scopo nel notare che ho scelto la risposta con i voti era quello di chiarire che tutte le risposte meritavano di essere lette. Tutti fanno buoni punti, incluso te qui in fondo. Qualcuno che si sta chiedendo di queste cose non dovrebbe limitarsi alla prima o alla seconda risposta.
Steve Kallestad,

Votare per trovare la risposta giusta è un'idea orribile. È il modo sbagliato di avvicinarsi alla matematica. Hai chiaramente perso il mio punto.
user13985

2

Penso che l'effetto della certificazione da parte del corso dipenda dall'individuo e dalle classi. Il requisito dice almeno 3-5 ore a settimana, se ne metti di più e il materiale si apre per molto più delle 3-5 ore, quindi queste classi e certificazioni possono essere equivalenti a una solida base di conoscenze ed esperienza sul campo . La scienza arriva a coloro che la richiedono.


2

Ho quasi finito con la Johns Hopkins Data Science Specialization su Coursera (un corso e una pietra miliare lasciati per laurearmi). Ti darò solo i pro e i contro, cercando di mantenerlo il più obiettivo possibile:

Pro :

  • Struttura attorno al processo di apprendimento
  • Costruirai un portfolio nel tempo

Contro :

  • Diversi background necessari per diversi corsi. I primi corsi non presuppongono conoscenze precedenti. Improvvisamente non è facile da capire nei corsi concettuali. (Inferenza statistica, analisi di regressione)
  • Insegnato da 3 professori. Penso che non siano sulla stessa pagina del loro potenziale pubblico e delle loro capacità / necessità / interessi.

2

Il modo migliore per avere successo nell'ottenere il lavoro che vuoi che mostri che puoi farlo.

I MOOC citati ti forniranno una buona base di base e dovrebbero essere sufficienti per iniziare a risolvere i tuoi problemi di machine learning / data science. Prova una o due gare Kaggle, che è un ottimo modo per migliorare le tue capacità e un voto decente ci sarà di interesse per un potenziale datore di lavoro. Pubblica i tuoi risultati su Github usando qualcosa come un notebook iPython, che consentirà di vedere e giudicare facilmente il tuo lavoro.

Prova un'analisi su altri set di dati pubblici, come l'UCI Bike Sharing Dataset , o l'UCI Diabetes Treatment Dataset che sono molto divertenti da provare e dimostra che sei appassionato e disposto a sviluppare le tue abilità.


2

Dipende molto dalla credibilità dell'istituzione che rilascia il certificato. Ad esempio, la certificazione Data Science di un'azienda con sede a Harvard è riconosciuta da molti partner del settore e può fare una buona scelta. Non hai detto che tipo di certificato stai cercando?


1

Valore per lo studente, borsa mista. Pagare diverse centinaia di dollari per un programma o cento pop per un corso è una motivazione.

Ho completato una serie, da MITx. Si tratta di un corso di indagine laureato su metodi e strumenti rivolto a coloro che devono "conoscere" in dettaglio. È sufficiente il fondamento, che mi sono sentito a mio agio nell'applicazione di ciò che ho imparato.

Un corso indipendente di HarvardX sul metodo del grafico aciclico diretto era più simile a un seminario di laurea in statistica sul metodo della Giudea Perla. Sarebbe passato molto tempo prima che ne venissi a conoscenza, altrimenti.

La serie HarvardX è un campo di addestramento di livello universitario volto a orientare il nuovo studente verso il set di strumenti e le applicazioni R.

La serie BerkeleyX è un corso di studi universitario che utilizza una classe Python appositamente costruita che è quasi un linguaggio specifico del dominio.

Per quanto riguarda il valore dei certificati, posso solo riferire che la mia unica esperienza educativa correlata è stata quella di un master in geofisica, e ho avuto circa un anno di esperienza retribuita al di fuori della mia descrizione del lavoro (avvocato di banca senior).

Forse a causa dei certificati, sono stato rifiutato come "troppo qualificato" per almeno due lavori che conosco. Quindi, il mio consiglio è che se hai un certificato non menzionarlo se compare la parola "Excel" nella registrazione del lavoro.


1

Alcune risorse su edX per corsi di data science di Harvard, MIT, Microsoft e altri che potrebbero interessare questo gruppo.

Ad esempio, abbiamo un programma di certificazione professionale di Harvard composto da 8 corsi e un esame capstone qui .

Per gli studi più avanzati, abbiamo un programma MICROMASTER dal MIT qui .

così come uno da UC San Diego qui . Per una fantastica panoramica di Data Science, abbiamo un programma Microsoft. Per tutti i nostri programmi puoi dare un'occhiata qui .

Spero che sia di aiuto,

Josh di edX

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.