Sto cercando input su come gli altri organizzano il loro codice R e output.
La mia pratica attuale è quella di scrivere il codice in blocchi in un file di testo come tale:
#=================================================
# 19 May 2011
date()
# Correlation analysis of variables in sed summary
load("/media/working/working_files/R_working/sed_OM_survey.RData")
# correlation between estimated surface and mean perc.OM in epi samples
cor.test(survey$mean.perc.OM[survey$Depth == "epi"],
survey$est.surf.OM[survey$Depth == "epi"]))
#==================================================
Quindi incollo l'output in un altro file di testo, di solito con alcune annotazioni.
I problemi con questo metodo sono:
- Il codice e l'output non sono esplicitamente collegati se non per data.
- Il codice e l'output sono organizzati in ordine cronologico e quindi possono essere difficili da cercare.
Ho preso in considerazione l'idea di creare un documento Sweave con tutto da quando ho potuto creare un sommario, ma sembra che potrebbe essere più una seccatura che i benefici che fornirebbe.
Fammi sapere di tutte le routine efficaci che hai per organizzare il tuo codice R e l'output che consentirebbe una ricerca efficiente e la modifica dell'analisi.
sink()
e capture.output()
. È fantastico.
sink()
ocapture.output()
potrebbero essere i tuoi amici. Vale la pena prendere in considerazione le utilità di reporting, come Hmisc , Sweave o brew (punto 1). I sistemi di versioning ( rcs , svn o git ) potrebbero aiutare con il punto 2.