Per una soluzione priva di complicate dipendenze esterne *, ora c'è readxl
:
Il pacchetto readxl semplifica l'estrazione dei dati da Excel e in R. Rispetto a molti dei pacchetti esistenti (ad esempio gdata, xlsx, xlsReadWrite) readxl non ha dipendenze esterne quindi è facile da installare e utilizzare su tutti i sistemi operativi. È progettato per funzionare con dati tabulari archiviati in un unico foglio.
Readxl supporta sia il formato legacy .xls che il moderno formato .xlsx basato su xml. Il supporto .xls è reso possibile dalla libreria C con libxls, che astrae molte delle complessità del formato binario sottostante. Per analizzare .xlsx, utilizziamo la libreria RapidXML C ++.
Può essere installato in questo modo:
install.packages("readxl") # CRAN version
o
devtools::install_github("hadley/readxl") # development version
Utilizzo
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
* non strettamente vero, richiede il Rcpp
pacchetto , che a sua volta richiede Rtools (per Windows) o Xcode (per OSX), che sono dipendenze esterne a R. Ma non richiedono alcuna manipolazione con i percorsi, ecc., quindi è un vantaggio rispetto alle dipendenze Java e Perl.
Aggiorna Ora è disponibile il pacchetto rexcel . Ciò promette di ottenere la formattazione di Excel, le funzioni e molti altri tipi di informazioni dal file Excel e in R.
.csv
.