Qual è la differenza tra scienza computazionale e scienza dei dati? [chiuso]


9

Background: il mio dottorato era in "scienza computazionale". La mia tesi di laurea era sull'analisi dei dati di diffrazione dei raggi X e sull'analisi dei nuclei perturbati termicamente nell'analisi dinamica globale della densità degli elettroni molecolari per la fisica dello stato solido. L'asporto? Era molto basato sulla scienza.

A mio avviso, la scienza computazionale è la ricerca della scienza, "... un'impresa sistematica che costruisce e organizza la conoscenza sotto forma di spiegazioni verificabili e previsioni sull'universo" ( wiki ), attraverso mezzi computazionali.

La maggior parte delle posizioni per "Data Science", tuttavia, sembrano più simili a tipi di lavoro di "analisi dei dati". Cioè, query SQL pesanti, che utilizzano modelli R e Python predefiniti (regressione lineare, ecc.) Per trarre conclusioni da dati strutturati e non strutturati.

La scienza computazionale è un superset di data science? Sono intercambiabili? Data Science è una vera "scienza"? La scienza computazionale è una vera "scienza"?


Penso che la domanda abbia un certo valore, ma dovresti risolverla un po '. Questa bozza di un rapporto in CSE potrebbe essere utile. Hanno qualche menzione sulla relazione tra i due. Potresti pensare a una relazione simile a quella tra scienza sperimentale e teorica, in qualche modo.
Nicoguaro

Risposte:


10

Non sono intercambiabili.

  • La scienza computazionale tende a riferirsi maggiormente all'HPC, alle tecniche di simulazione (equazioni differenziali, dinamiche molecolari, ecc.), E di solito viene definita informatica scientifica.

  • La scienza dei dati tende a riferirsi all'analisi dei dati ad alta intensità computazionale, come "big data", bioinformatica, apprendimento automatico (ottimizzazione), analisi bayesiane mediante MCMC, ecc. Penso che sia la stessa di quella che veniva definita statistica computazionale. Si trattava dell'infusione dell'informatica con le statistiche, ma molte delle tecniche sviluppate lasciarono cadere i rigorosi "test statistici" dei pescatori (raggruppamento, tecniche di convalida incrociata, visualizzazione dei dati) ma mantennero la parte dei dati.

La spiegazione più chiara di ciò mi è venuta durante l'insegnamento di un seminario su Julia per la scienza dei dati e il calcolo scientifico. I data scientist volevano imparare Julia al fine di eseguire rapidamente l'analisi dei "big data", ovvero regressioni e altri GLM su dati di grandi dimensioni. Gli scienziati computazionali (informatici scientifici?) Volevano sapere come scrivere facilmente il codice per risolvere grandi sistemi lineari su HPC e GPU.

Nota che sono due modi per dire gli stessi calcoli esatti, ma con significati molto diversi. Quindi, in un certo senso simile, ma comunque distinto (e c'è un incrocio tra le discipline, come usare l'apprendimento automatico per apprendere i parametri per i PDE dai dati).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.