Sto cercando di visualizzare il mio flusso di dati con un diagramma di Sankey in R.
Ho trovato questo post sul blog che si collega a uno script R che produce un diagramma di Sankey, sfortunatamente è piuttosto grezzo e alquanto limitato (vedi sotto per codice e dati di esempio).
Qualcuno conosce altri script, o forse anche un pacchetto, più sviluppato? Il mio obiettivo finale è visualizzare sia il flusso di dati che le percentuali in base alla dimensione relativa dei componenti del diagramma, come in questi esempi di diagrammi di Sankey .
Ho pubblicato una domanda in qualche modo simile nell'elenco di r-help , ma dopo due settimane senza risposte sto tentando la fortuna qui su stackoverflow.
Grazie, Eric
PS. Sono a conoscenza del Parallel Sets Plot , ma non è quello che sto cercando.
# thanks to, https://tonybreyal.wordpress.com/2011/11/24/source_https-sourcing-an-r-script-from-github/
sourc.https <- function(url, ...) {
# install and load the RCurl package
if (match('RCurl', nomatch=0, installed.packages()[,1])==0) {
install.packages(c("RCurl"), dependencies = TRUE)
require(RCurl)
} else require(RCurl)
# parse and evaluate each .R script
sapply(c(url, ...), function(u) {
eval(parse(text = getURL(u, followlocation = TRUE,
cainfo = system.file("CurlSSL", "cacert.pem",
package = "RCurl"))), envir = .GlobalEnv)
} )
}
# from https://gist.github.com/1423501
sourc.https("https://raw.github.com/gist/1423501/55b3c6f11e4918cb6264492528b1ad01c429e581/Sankey.R")
# My example (there is another example inside Sankey.R):
inputs = c(6, 144)
losses = c(6,47,14,7, 7, 35, 34)
unit = "n ="
labels = c("Transfers",
"Referrals\n",
"Unable to Engage",
"Consultation only",
"Did not complete the intake",
"Did not engage in Treatment",
"Discontinued Mid-Treatment",
"Completed Treatment",
"Active in \nTreatment")
SankeyR(inputs,losses,unit,labels)
# Clean up my mess
rm("inputs", "labels", "losses", "SankeyR", "sourc.https", "unit")
Diagramma Sankey prodotto con il codice sopra,