Come definiamo la "ricerca riproducibile"?


50

Questo è emerso in alcune domande ora, e mi chiedevo qualcosa. Il campo nel suo insieme si è spostato verso la "riproducibilità" concentrandosi sulla disponibilità dei dati originali e sul codice in questione?

Mi è stato sempre insegnato che il nucleo della riproducibilità non era necessariamente, come ho fatto riferimento ad esso, la possibilità di fare clic su Esegui e ottenere gli stessi risultati. L'approccio basato su dati e codice sembra presupporre che i dati siano corretti e che non vi sia un difetto nella raccolta dei dati stessi (spesso in modo dimostrabile falso in caso di frode scientifica). Si concentra anche su un singolo campione della popolazione target, piuttosto che sulla replicabilità della scoperta su più campioni indipendenti.

Perché l'enfasi è quindi sulla possibilità di rieseguire l'analisi, piuttosto che duplicare lo studio da zero?

L'articolo menzionato nei commenti qui sotto è disponibile qui .


Buona domanda ! Ho inserito un riferimento al documento di donoho nella mia risposta, ma quali sono i tuoi riferimenti scritti sulla ricerca riproducibile?
Robin Girard,

Reiter e Kinney hanno una carta in emissione di questo mese di Epidemiologia chiama 'condivisione dati riservati per scopi di ricerca: A Primer' che aiuta a ottenere a come rendere il codice ei dati disponibili in circostanze in cui non si può semplicemente tirare a sorte un file .csv, e deve garantire che la riservatezza rimanga intatta.
Fomite,

@EpiGrad, dal momento che "questo mese" è passato, avere un link all'articolo sarebbe utile. Grazie per aver posto una bella domanda che contribuisce al CV e all'analisi scientifica / dei dati!
gung - Ripristina Monica

@gung Che articolo è quello?
Fomite

@EpiGrad appena sopra, Reiter e Kinney. +1 btw
gung - Ripristina Monica

Risposte:


41

"Ricerca riproducibile" come analisi riproducibile

La ricerca riproducibile è un termine usato in alcuni settori di ricerca per riferirsi specificamente alla conduzione di analisi tali

  • il codice trasforma i dati grezzi e i metadati in dati elaborati,
  • il codice esegue analisi sui dati e
  • il codice incorpora le analisi in un report.

Quando tali dati e codici sono condivisi, ciò consente ad altri ricercatori di:

  • eseguire analisi non riportate dai ricercatori originali
  • verificare la correttezza delle analisi eseguite dai ricercatori originali

Questo utilizzo può essere visto nelle discussioni su tecnologie come Sweave . Ad esempio, Friedrich Leisch scrive nel contesto di Sweave che "il rapporto può essere aggiornato automaticamente se i dati o l'analisi cambiano, il che consente una ricerca realmente riproducibile". Può anche essere visto nella Task View CRAN sulla ricerca riproducibile che afferma che "l'obiettivo della ricerca riproducibile è legare istruzioni specifiche all'analisi dei dati e ai dati sperimentali in modo che la borsa di studio possa essere ricreata, meglio compresa e verificata".

Ampio uso del termine "riproducibilità"

La riproducibilità è un obiettivo fondamentale della scienza. Non è nuovo I rapporti di ricerca includono sezioni di metodi e risultati che dovrebbero delineare il modo in cui i dati sono stati generati, elaborati e analizzati. Una regola generale è che i dettagli forniti dovrebbero essere sufficienti per consentire a un ricercatore adeguatamente competente di acquisire le informazioni fornite e replicare lo studio.

La riproducibilità è inoltre strettamente correlata ai concetti di replicabilità e generalizzazione.

Pertanto, il termine "ricerca riproducibile", preso alla lettera, applicato a tecnologie come Sweave, è un termine improprio, dato che suggerisce una rilevanza più ampia di quanto non copra. Inoltre, quando si presentano tecnologie come Sweave ai ricercatori che non hanno utilizzato tali tecnologie, tali ricercatori sono spesso sorpresi quando chiamo il processo "ricerca riproducibile".

Un termine migliore di "ricerca riproducibile"

Dato che la "ricerca riproducibile" utilizzata in contesti simili a quelli di Sweave riguarda solo un aspetto della ricerca riproducibile, forse dovrebbe essere adottato un termine alternativo. Le possibili alternative includono:

Tutti i termini sopra riportati riflettono in modo più accurato ciò che comporta un'analisi simile a Sweave. L'analisi riproducibile è breve e dolce. L'aggiunta di "dati" o "statistici" chiarisce ulteriormente le cose, ma rende anche il termine più lungo e più stretto. Inoltre, "statistico" ha un significato stretto e ampio, e certamente nel senso stretto, gran parte del trattamento dei dati non è statistico. Pertanto, l'ampiezza implicita dal termine "analisi riproducibile" presenta i suoi vantaggi .

Non si tratta solo di riproducibilità

L'altro problema aggiuntivo con il termine "ricerca riproducibile" è che l'obiettivo delle tecnologie simili a Sweave non è solo "riproducibilità". Esistono diversi obiettivi correlati:

  • Riproducibilità
    • Le analisi possono essere facilmente rieseguite per trasformare i dati grezzi in report finali con gli stessi risultati?
  • Correttezza
    • L'analisi dei dati è coerente con le intenzioni del ricercatore?
    • Le intenzioni del ricercatore sono corrette?
  • Apertura
    • Trasparenza, responsabilità
      • Altri possono verificare e verificare l'accuratezza delle analisi eseguite?
    • Estensibilità, modificabilità
      • Altri possono modificare, estendere, riutilizzare e mescolare, i dati, le analisi o entrambi per creare nuovi lavori di ricerca?

C'è un argomento secondo cui l'analisi riproducibile dovrebbe promuovere analisi corrette, poiché esiste una registrazione scritta di analisi che possono essere verificate. Inoltre, se i dati e il codice sono condivisi, creano responsabilità che motiva i ricercatori a controllare le loro analisi e consente ad altri ricercatori di annotare le correzioni.

L'analisi riproducibile si adatta anche strettamente ai concetti relativi alla ricerca aperta. Naturalmente, un ricercatore può utilizzare tecnologie simili a Sweave solo per se stesso. I principi di ricerca aperta incoraggiano la condivisione dei dati e il codice di analisi per consentire un maggiore riutilizzo e responsabilità.

Questa non è una vera critica all'uso della parola "riproducibile". Piuttosto, sottolinea solo che l'uso di tecnologie simili a Sweave è necessario ma non sufficiente per raggiungere obiettivi di ricerca scientifica aperti.


2
(+1) Ottima risposta, punti molto buoni. Sono d'accordo che dovremmo chiamare ciò che Sweave e gli amici fanno analisi riproducibili .
NRH,

1
(+1) bella panoramica. ma vorrei notare che il termine "dati grezzi" è ambiguo e può essere fuorviante: i dati vengono generalmente elaborati prima della fase in cui sono considerati "grezzi", anche solo per inserirli nella macchina.
David LeBauer,

@Jeromy Anglim Questa è un'ottima risposta, ed è al centro di ciò che mi infastidisce della semantica della "ricerca riproducibile" - è usata per descrivere un processo che ha luogo solo dopo che il processo di generazione dei dati è completo. Mi piace l'idea di "Analisi riproducibile" come termine.
Fomite,

+1 @ Jeromy Anglim, di recente ho contattato un autore per vedere se poteva condividere il Rcodice utilizzato nella pubblicazione, l'autore ha rifiutato di farlo e mi ha indicato la pubblicazione. Secondo te, lo considereresti come una mancanza di apertura per la ricerca riproducibile o è sufficiente rendere esplicita la metodologia nella rivista e lasciare che altri programmi lo stesso codice? Grazie
previsioni

11

Avere accesso ai dati e al codice per l'analisi in una forma facile da eseguire è una condizione sine qua non della ricerca riproducibile. Una volta verificato che l'analisi funziona, è possibile sostituire il proprio codice / dati laddove si è scettici rispetto all'autore originale. Direi che la maggior parte degli articoli contenenti statistiche che ho letto hanno almeno una parte della metodologia che è rimasta vaga. I miei tentativi di riprodurre queste analisi sono spesso infruttuosi (e sempre dispendiosi in termini di tempo), ma è molto difficile stabilire se ciò sia dovuto a frode, errore umano o (molto più probabile) alla mia risoluzione di queste ambiguità in modo diverso dall'autore. Quindi, avere dati + codice per un documento non garantisce che le sue conclusioni siano vere, ma rende molto più facile criticarle o estenderle.

Inoltre, la "ricerca riproducibile" è una questione di laurea. Quindi il movimento di ricerca riproducibile può essere visto come una ricerca incoraggiante che è "più riproducibile" della norma, piuttosto che esigere che la ricerca soddisfi una soglia minima. Immagino che "rilasciare dati e codice" sia in voga ora perché è un passaggio relativamente semplice e non minaccioso.


9

Essere in grado di rieseguire tutto è un punto di partenza per la ricerca riproducibile. Permette di dimostrare che stai effettivamente utilizzando la stessa procedura. Dopo ciò, e solo dopo, puoi proseguire la ricerca del tuo pari. In altre parole, la rigida riproducibilità non deve essere percepita come un momento in cui la ricerca sta andando avanti, ma come un punto di riferimento, un consenso , qualcosa su cui le persone concordano. Non è fondamentale andare oltre?

Inoltre, secondo la discussione di Donoho (leggi la sezione 2 "Lo scandalo") lo scopo della ricerca riproducibile è anche quello di testare la solidità del codice dato. In primo luogo giocando con il codice, apportando modifiche alla sligth che non sono state fatte nel documento (perché non vogliamo carte con 30 figure ...). Penso che il concetto di ricerca riproducibile nella letteratura contenga l'idea di avere un punto di riferimento solido e robusto. Contiene quasi l'idea di andare oltre.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.