sfondo
Sto supervisionando l'inserimento di dati dalla letteratura primaria in un database . Il processo di immissione dei dati è soggetto a errori, in particolare perché gli utenti devono interpretare la progettazione sperimentale, estrarre dati da grafici e tabelle e trasformare i risultati in unità standardizzate.
I dati vengono immessi in un database MySQL tramite un'interfaccia web. Finora sono stati inclusi oltre 10k punti dati da> 20 variabili,> 100 specie e> 500 citazioni. Devo eseguire controlli della qualità non solo dei dati variabili, ma anche dei dati contenuti nelle tabelle di ricerca, come le specie associate a ciascun punto dati, l'ubicazione dello studio, ecc.
L'immissione dei dati è in corso, pertanto sarà necessario eseguire il controllo qualità / controllo qualità in modo intermittente. I dati non sono ancora stati resi pubblici, ma stiamo pianificando di rilasciarli nei prossimi mesi.
Attualmente, il mio QA / QC prevede tre passaggi:
- un secondo utente controlla ciascun punto dati.
- ispezionare visivamente l'istogramma per ogni variabile per valori anomali.
- gli utenti riportano dati discutibili dopo aver ottenuto risultati spuri.
Domande
- Ci sono linee guida che posso usare per sviluppare una solida procedura di QA / QC per questo database?
- Il primo passo è il più dispendioso in termini di tempo; c'è qualcosa che posso fare per renderlo più efficiente?