Come revisore, posso giustificare che la richiesta di dati e codice sia resa disponibile anche se il diario non lo fa?


23

Poiché la scienza deve essere riproducibile, per definizione, vi è un crescente riconoscimento del fatto che dati e codice sono una componente essenziale della riproducibilità, come discusso dalla tavola rotonda di Yale per la condivisione di dati e codice .

Nel riesaminare un manoscritto per un giornale che non richiede la condivisione di dati e codice, posso richiedere che i dati e il codice siano resi disponibili

  1. a me al momento della recensione
  2. pubblicamente al momento della pubblicazione (la rivista supporta integratori)

inoltre, come potrei esprimere una simile richiesta?


aggiornamento : anche se sono interessato al caso generale, questo caso particolare consiste in una meta-analisi con tutti i dati precedentemente pubblicati e il codice è un semplice modello lineare in SAS

nota a margine la capacità di fare inferenza tra studi (come l'obiettivo della meta-analisi) sarebbe notevolmente migliorata se più studi fornissero dati grezzi

aggiornamento 2 :

Ho richiesto i dati e il codice all'editore a fini di revisione, l'editore ha ritenuto ragionevole la richiesta e ho ricevuto il materiale richiesto (sufficiente ma con nomi di variabili criptici, senza metadati e pochi commenti incorporati) in un giorno.


3
Personalmente, starei bene con il codice praticamente in ogni circostanza. I dati sono un altro problema. A meno che non sia già disponibile pubblicamente, probabilmente non avrò il permesso di condividerlo con nessuno. Sospetto che ciò renda irragionevole una richiesta di dati in molte circostanze.
Andy W,

4
Sembra qualcosa che dovresti discutere con il tuo editore o editore associato. Se stanno facendo il loro lavoro, dovrebbero essere in grado di fornirti una guida e probabilmente servirebbero come punto di contatto per gli autori per qualsiasi richiesta in tal senso.
cardinale il

1
Mi sembra che molti degli esempi e delle successive discussioni si basino su situazioni aneddotiche che possono variare enormemente a seconda della disciplina e dei dati di cui stiamo parlando. Certo alcune situazioni sembrano perfettamente ragionevoli per diffondere i dati, ma ciò non caratterizza necessariamente tutte le situazioni. Questa domanda si sta trasformando molto rapidamente in un rant!
Andy W,

1
Qualche suggerimento su come allontanarsi da un rant? ad es. distinzioni che dovrebbero essere fatte nel PO o modifiche alle risposte (dopo tutto è CW).
Abe,

1
Penso che questo modulo abbia una propensione alla selezione :-). Molti di noi sono qui perché la maggior parte di noi supporta l'idea dei PO in qualche modo.
suncoolsu,

Risposte:


7

Per quanto riguarda la ricezione di dati come revisore, hai diritto a ciò se ne hai bisogno per completare correttamente la recensione. Più revisori dovrebbero chiedere dati e valutarli. Molte riviste hanno politiche che potrebbero richiedere i dati e il codice di analisi a fini di revisione.

La disponibilità al momento della pubblicazione non mi è chiara. Sembra che tu stia dicendo che vuoi forzare il problema che i dati siano resi pubblici come condizione di pubblicazione. È una cattiva idea se non si tratta già di una politica del journal. Stai rendendo la pubblicazione un obiettivo mobile iniquo. Hanno presentato aspettandosi che non fosse un requisito e tu, né l'editore, dovresti cambiare il gioco.

All'insaputa di molti ricercatori finanziati con fondi pubblici, sono tenuti a rendere i loro dati disponibili al pubblico. Ad esempio, la maggior parte delle borse di studio NIH ha delle clausole in cui il ricercatore deve presentare i propri dati. La maggior parte delle agenzie di finanziamento statali hanno clausole di condivisione dei dati che obbligano il ricercatore a condividere ciò che trovano (forse la forza è un po 'forte dato che è molto difficile perdere una sovvenzione al di sopra di questo ... forse perdere il rinnovo però). Il pubblico ha pagato i dati, quindi il pubblico ne ha diritto --- nel caso della ricerca umana, il cui diritto è anonimo.

Alcuni dei dati più costosi e sensibili da raccogliere, i dati FMRI umani, sono anche alcuni dei più comunemente resi pubblici. Non solo PLoS, ma le principali riviste del settore richiedono l'invio dei dati e la gestione di una banca dati accessibile al pubblico. Penso che ciò dica molto alle persone che obiettano per motivi di costo (è molto costoso) e di privacy (sono dati umani provenienti da piccoli studi e talvolta popolazioni cliniche uniche che potrebbero essere molto sensibili). Questi sono i motivi che rendono tali dati più preziosi per il pubblico. I ricercatori che trattengono tali dati stanno facendo un disservizio alle persone che li hanno acquistati (tutti) e hanno bisogno di una lezione su quali sono le loro responsabilità al di fuori del loro piccolo laboratorio e della competizione di pubblicazione.

Se la ricerca è stata finanziata privatamente, autenticamente finanziata privatamente, allora buona fortuna.


Concordo con la maggior parte di ciò che c'è in questo documento - ci sono già requisiti per divulgare i dati - di solito ad altri ricercatori qualificati - in sovvenzioni finanziate da NIH e simili. Ma penso che estenderlo a un requisito ad hoc per la pubblicazione superi enormemente il ruolo di revisore.
Fomite,

1
(+1) Risposta ponderata e ben articolata. Una cosa da tenere a mente è che questo sito ha un pubblico abbastanza internazionale. Spero che un numero maggiore di ricercatori abbia una visione collaborativa della propria ricerca e dei propri dati anche se non ci sono NIH o altre organizzazioni che si torce il braccio.
cardinale il

EpiGrad, nel caso in cui non fosse chiaro dalla risposta, ho sentito di fare un requisito ad hoc per la pubblicazione non solo oltrepassando i limiti del revisore, ma anche dell'editor.
Giovanni,

Cardinale, grazie per il complimento. Grazie anche per il promemoria. Cerco di tenere presente che il sito è internazionale. Grande come NIH, non è nel mio paese. ;)
Giovanni,

@John. Sì - ho appena dimenticato di mettere +1 mentre sono d'accordo con te :)
Fomite

6

Affrontare le due situazioni separatamente:

Come revisore: Sì, penso che avresti motivi per chiedere di vedere i dati o il codice. Ma se fossi in te, mi preparerei a vedere cose come il codice ridotto o un sottocampione dei dati. Le persone implementano ricerche future non riportate in questo documento nel loro codice per tutto il tempo e non hai diritto a detto codice. Dato che svolgo principalmente ricerche biomediche, sarei anche pronto a dover affrontare alcuni accordi sull'uso dei dati abbastanza restrittivi.

Nel diario stesso: No. Se un ricercatore vuole riprodurre i miei risultati, può avvicinarsi a me stesso per chiedere il codice - ecco perché abbiamo autori corrispondenti. Per i dati, assolutamente no, in nessun caso. I miei dati sono regolati dall'IRB e dagli accordi di riservatezza - non saranno solo resi pubblici. Se voglioun set di dati pubblico, potrei simulare un set di dati con proprietà simili (ovvero i dati di rete "Faux-Mesa" disponibili in uno dei pacchetti di rete per R), ma come revisore non hai chiamate per forzare . Se si tratta di un requisito a livello di giornale, gli autori sapevano che i loro dati / codice sarebbero stati pubblici al momento dell'invio, ma se non lo è, allora no. Il tuo ruolo è di valutare la qualità del documento stesso (quindi il mio stare bene con esso ai fini della revisione), non usare la tua capacità di contribuire all'accettazione / rifiuto del documento per spingere ciò che è essenzialmente un punto filosofico / politico al di fuori dell'ambito del giornale.

Nella migliore delle ipotesi, aggiungerei un "Vorrei fortemente esortare gli autori a rendere il loro codice e i dati disponibili, ove possibile" nei tuoi commenti, ma non lo definirei più forte di così, e non lo inserirei l'elenco formale di "Cose che ritengo debbano essere risolte prima che ciò accenda la luce del giorno".


Ho appena notato le tue modifiche: in questo caso, per quanto riguarda il documento, la risposta è in realtà un "no" più forte - supponendo che il documento abbia citazioni. Se il punto della richiesta è "ricerca riproducibile" e i dati sono reperibili pubblicamente, allora non c'è motivo per cui un ricercatore che cerca di confermare i risultati non possa farlo da solo. Inoltre, se il punto è effettivamente valutare la scienza, piuttosto che semplicemente dimostrare che anche tu puoi fare clic su "Esegui" e ottenere gli stessi risultati, passare da solo attraverso il processo di ricerca e astrazione nella literaute fa parte della verifica di un risultato.
Fomite,

affinché la ricerca sia riproducibile, la versione del codice e dei dati utilizzati nell'analisi dovrebbe essere resa disponibile e il codice non utilizzato nell'analisi non sarebbe previsto (o necessariamente pertinente).
David LeBauer,

@EpiGrad: ad un certo livello, non sono del tutto d'accordo con questo forte no . Keith Baggerly ha recentemente evangelizzato su questo argomento e fa alcune interessanti osservazioni. Vedi, ad esempio, KA Baggerly e KR Coombes, Derivazione della chemosensibilità dalle linee cellulari: bioinformatica forense e ricerca riproducibile nella biologia ad alto rendimento , Ann. Appl. Statistica. , vol 3, n. 4, pagg. 1309-1334. Esiste anche una versione di arxiv .
cardinale il

Conosco pochissimi ricercatori finanziati da sovvenzioni che hanno problemi di riservatezza e IRB che limitano realmente la pubblicazione di dati adeguatamente anonimizzati. Se ti trovi in ​​quella situazione è un caso abbastanza raro.
Giovanni,

@EpiGrad Metto anche in discussione il forte no . I metodi utilizzati per ottenere dai dati grezzi alla metrica derivata in una meta-analisi spesso richiedono una vasta gamma di ipotesi relative alle differenze nella metodologia e nell'interpretazione che si verificano a livello di uno studio individuale. In questo caso, ci sono oltre 200 studi rappresentati, quindi il tempo necessario per ricostruire il set di dati sarebbe proibitivo e alla fine inibirebbe l'obiettivo finale della scienza in progresso.
David LeBauer,

5

Come dice John, la disponibilità dei dati per i revisori dovrebbe essere un gioco da ragazzi; un'attenta revisione dovrebbe includere la replica dell'analisi e in quanto tale richiede l'accesso ai dati.

Per quanto riguarda la disponibilità pubblica dei dati a seguito della pubblicazione, direi che la battaglia dovrebbe essere combattuta con il giornale in generale piuttosto che per quanto riguarda una presentazione specifica.

Su una nota più generale, le agenzie di finanziamento e gli IRB stanno diventando sempre più consapevoli del fatto che la condivisione dei dati è sia componente scientifica che etica necessaria della ricerca. Aumentando la disponibilità per la nuova analisi che potrebbe produrre nuovi risultati di rapporti errati corretti, la condivisione dei dati aumenta i potenziali benefici per la ricerca, modificando così il compromesso costi / benefici a vantaggio dei partecipanti alla ricerca. Certamente è necessario informare i partecipanti della possibilità che i loro dati saranno condivisi, ed è anche necessario istituire garanzie per prevenire un aumentato rischio di identificazione per i partecipanti, ma questi possono essere raggiunti nella maggior parte dei casi. Nella mia ricerca, assicuro ai partecipanti (e al mio IRB) che (1) i dati saranno archiviati in un formato crittografato forte (aggiornato con l'avanzare della tecnologia di decrittazione),


1

Non ho alcuna esperienza con questo, ma mi sembra che potresti essere in grado di insistere sul numero 1 come parte della tua due diligence nella revisione dei loro risultati. Non vedo come puoi insistere sul n. 2, però.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.