Qual è la differenza tra statistica e informatica?


10

Diciamo sempre che le statistiche riguardano solo i dati. Sappiamo anche che anche l'informatica sta acquisendo conoscenza dall'analisi dei dati. Ad esempio, le persone bioinformatiche possono andare completamente senza biostatistica. Voglio sapere qual è la differenza essenziale tra statistica e informatica.


7
No, questo è solo perché la parola "informatica" ha completamente perso il significato definitivo. La "bioinformatica" è stata coniata solo per "la biologia fatta al computer", non c'è nulla di profondo in questo.

1
@mbq concordato. "Informatica" e "Bioinformatica" hanno perso qualsiasi definizione significativa.
Fomite,

in modo chiaro bioinformatica (applica i tuoi risultati per osservare i tuoi risultati in modo biologico)
Kamal Alblwei

Risposte:


20

Ottima domanda !!

Ho sentito più volte che i bioinformatici possono andare senza biostatistica o persino senza statistiche. Questo è perfettamente vero fino a quando non diventa falso. Secondo me, la generale mancanza di conoscenza statistica ha effetti disastrosi sul campo, come dimostrato da Keith Baggerly . Ho anche potuto osservare che la mancanza di conoscenze di base in statistica (e algebra lineare) è la causa della stagnazione dei bioinformatici a lungo termine: senza una profonda conoscenza della teoria, tendono a reinventare la ruota e ricorrere a soluzioni ad hoc che risolvono nient'altro che il loro problema.

Ma ora, per rispondere alla tua domanda, sono d'accordo sul fatto che, al giorno d'oggi, le statistiche non possono fare a meno dei computer. Tuttavia, uno dei principali aspetti della statistica è l' inferenza , che non ha nulla a che fare con i computer. L'inferenza statistica è in realtà ciò che rende la statistica una scienza, perché ti dice se le tue conclusioni reggono o meno in altri contesti.

In breve, puoi analizzare l'inferno dei tuoi dati, avrai comunque bisogno di statistiche per conoscere la validità delle previsioni o delle decisioni che prenderai sulla base delle tue analisi.


Grazie. Potresti spiegare di più su quale sia il principio generale alla base della bioinformatica per renderla una disciplina. Per la statistica, in generale, ci sono due parti principali, una è la pura manipolazione dei dati, l'altra è l'inferenza statistica, che si basa sulla probabilità, una della matematica pura. Basato su modelli statistici (modelli di probabilità), le persone statistiche possono fare scienza. E la bioinformatica?
Honglang Wang,

4
La bioinformatica è semplicemente l'uso dei computer per studiare questioni biologiche. Le discipline sono generalmente definite dalle domande che pongono, non dai loro metodi, quindi secondo me la bioinformatica dovrebbe far parte della biologia. Ha un nome speciale perché i biologi sono molto cattivi con i computer, quindi le persone che possono farlo devono avere un'etichetta speciale. Non sono sicuro che tra 50 anni, quando i biologi saranno più bravi in ​​informatica e matematica, la bioinformatica esisterà ancora.
gui11aume,

2
È bello vedere qualcun altro che apprezza gli sforzi di Keith. Di certo non ha evitato controversie o situazioni professionali difficili e scomode.
cardinale il

@cardinal Saw Keith parla in una conferenza APHA uno o due anni fa. È stato uno dei migliori discorsi che abbia mai visto.
Fomite,

9

La mia opinione è che mentre c'è una buona dose di sovrapposizione tra i campi ci sono anche differenze chiave. In generale uno studente di statistica (nei livelli più alti) prenderà più lezioni di teoria (matematica e matematica) rispetto allo studente di informatica, ma lo studente di informatica imparerà di più dal lato dell'informatica (specialmente la parte del database).

Lo sviluppo di un nuovo test statistico ricadrebbe più sullo statistico che sull'informatico, ma progettare un'interfaccia per un utente per inserire dati e produrre tabelle e diagrammi ricadrebbe più sull'informatico che sullo statistico.

Per lo statistico il computer è uno strumento per aiutare con le statistiche. Per l'informatica le statistiche sono uno strumento per aiutare a raccogliere e distribuire informazioni (generalmente tramite computer).

Modifica qui sotto -----

Per esaltare, ecco un esempio. Ho lavorato a progetti con informatici (io sono lo statistico) in cui un medico vuole avere un sistema in cui le informazioni sui pazienti vengono utilizzate per prevedere il rischio di alcune condizioni (sviluppando un coagulo di sangue per esempio) e vuole ricevere qualche forma di attento a far loro conoscere il rischio. Il mio ruolo nel progetto (ruolo statistico) è quello di sviluppare un modello che preveda il rischio date le variabili del predittore (un modello di regressione logistica è uno di questi). Il ruolo di informatico nel progetto è quello di sviluppare gli strumenti che raccolgono le variabili predittive, utilizzare il mio modello su di esse, quindi inviare i risultati al medico. I dati possono essere raccolti da una cartella clinica elettronica o attraverso una schermata di immissione dei dati che può essere compilata da un infermiere o altri.

Ora (e molti altri statistici) conosco abbastanza della programmazione da poter interrogare un database per ottenere i predittori e creare un qualche tipo di avviso, ma sono felice di lasciarlo agli informatici (e comunque sono più bravi a farlo). Ci sono informatici che conoscono abbastanza statistiche per adattarsi al modello di regressione logistica. Quindi una versione semplice di questo progetto potrebbe essere fatta solo da uno statistico o solo da un informatico, ma è meglio quando entrambi lavorano insieme. Se guardi questo progetto e pensi che la parte di modellazione sia la parte divertente e la raccolta di dati, avvisi e altre interfacce sono solo strumenti per spostare le informazioni da e verso il modello, allora sei più uno statistico. Se vedi progettare l'interfaccia, ottimizzare il recupero dei dati, testare diversi tipi di avvisi, ecc.


(+1) Mi piace il saldo di questa risposta. Non sono sicuro di aver capito bene cosa intendesse l'ultima frase.
cardinale il

1
Penso che il tuo esempio sia molto bello e dia un buon ritratto della base del terreno. Vorrei poterlo votare ancora per quella parte. Saluti.
cardinale il

Il tuo esempio è davvero fantastico. Molte grazie. Ora mi sto solo chiedendo una domanda. Per gli statistici, se tutto il modello statistico dovrebbe avere una parte di inferenza, come l'intervallo di confidenza o il test di ipotesi, e quindi basato su modelli di probabilità? Altrimenti, manipolano il set di dati solo tramite la stampa e il riepilogo.
Honglang Wang,

9

Le statistiche derivano dai dati; L'informatica opera sui dati. Ovviamente si sovrappongono, ma la cui domanda ha una portata più ampia non ha risposta.


"La statistica deduce dai dati; l'informatica opera sui dati." Questo è davvero ciò che voglio confermare. Per l'inferenza, sempre basata sulla distribuzione di probabilità, dovrebbe includere un intervallo di confidenza o un test di ipotesi. Altrimenti, stai solo operando sui dati.
Honglang Wang,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.