Opzioni di hosting per dati disponibili pubblicamente


12

Quindi hai deciso di supportare l'idea della ricerca riproducibile e vuoi rendere i tuoi dati disponibili online affinché le persone possano vederli e utilizzarli. La domanda è: dove lo si ospita?

La mia prima inclinazione è ovviamente lo spazio web privato che ho su un server universitario, ma queste cose in realtà non sono poi così persistenti - se lascio, la directory rimane aperta per un periodo di tempo molto breve prima che svanisca. Difficilmente la giusta impostazione per mantenere i dati disponibili per le persone da utilizzare e lavorare in futuro.

Usi qualcosa come GitHub o SourceForge? O un altro servizio?

I dati in questione sono l'output di alcune simulazioni di interesse molto ristretto, quindi non penso necessariamente che un posto come InfoChimps o un altro dei repository di dati pubblici sia la casa giusta per questo. Questo è meno "Puoi imparare cose con questo codice!" e altro "Puoi replicare la Figura 3 in questo documento".



1
Assolutamente rilevante - l'aggiunta di alcuni dettagli che suggeriscono perché non pensavo fosse un duplicato.
Fomite,

@EpiGrad: che tipo di appuntamento hai in mente? Se si tratta di un codice sorgente correlato al progetto di ricerca, è possibile collegarlo alla prestampa arXiv .
Piotr Migdal,

@PiotrMigdal Idealmente, vorrei che i dati potessero rimanere in sospeso per diversi anni, abbastanza a lungo per consentire la normale propagazione delle citazioni su carta, ecc. Lo
collegherei

@EpiGrad Quindi forse un buon posto in cui cercare è Open Data come aspetto di Open Science - michaelnielsen.org/blog/open-science .
Piotr Migdal

Risposte:


4

Un'opzione semplice è github .

Lo uso un po ' per condividere dati e codice di analisi dei dati. Alcuni buoni esempi di altri che condividono codice e dati sul sito sono elencati su questa domanda .

Vantaggi di Github

  • Facile da caricare una volta acquisita familiarità con git e perché non utilizzare git per le esigenze di controllo della versione.
  • Puoi usare le sintesi per semplici file singoli
  • È facile per gli altri scaricare file singoli o multipli come archivio
  • Ha una buona quantità di spazio di archiviazione gratuito
  • il codice sorgente può essere consultato su Internet
  • e altro ancora ...

Naturalmente, github non è perfetto per i dati. Riesco a vedere i vantaggi di utilizzare un repository istituzionale più permanente o qualche altro strumento dedicato per l'archiviazione più seria.


1
Questa è in realtà la soluzione con cui sono andato. Parte del problema con un repository istituzionale è che l'istituzione in cui mi trovo è in evoluzione e i dati non sono abbastanza importanti per uno dei grandi magazzini di dati.
Fomito

4

Un'altra opzione sembra essere Dataverse , disponibile come servizio e come software open source. Non l'ho provato, però.


2

Una possibilità per coloro che lavorano nel mondo accademico è l'uso di un repository digitale del campus spesso ospitato dalle biblioteche del campus (per me un luogo logico per i set di dati che accompagnano le pubblicazioni).

Un repository digitale (gratuito) popolare è DSpace che, a mio avviso, può ospitare set di dati. Ma questo è un servizio che qualcuno nel tuo istituto deve ospitare.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.