Quali pacchetti R trovi più utili nel tuo lavoro quotidiano?


28

Thread duplicato: ho appena installato l'ultima versione di R. Quali pacchetti dovrei ottenere?

Quali sono i pacchetti R che non puoi immaginare il tuo lavoro quotidiano con i dati? Elenca gli strumenti generali e specifici.

AGGIORNAMENTO: il 24.10.10 ggplot2sembra essere il vincitore con 7 voti.

Altri pacchetti citati più di uno sono:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Grazie a tutti per le risposte!


1
Domanda molto soggettiva: non è possibile rispondere a questa domanda e non è adatta per un sito di controllo qualità.
Egon Willighagen,

3
Probabilmente dovrebbe essere wiki della comunità; domanda utile qui ma non ha una risposta definitiva.
Shane,

2
@Shane: buon punto. mosso. @Egon: soggettivo davvero. ma se le risposte arrivano da persone esperte non mi dispiace per la dose di soggettività. ho iniziato a studiare R abbastanza di recente e ne ho installate un paio di dozzine da esplorare, tuttavia noto che ci sono strumenti che utilizzo molto più spesso indipendentemente dall'attività da svolgere.
Radek,

Sarebbe interessante se StackExchange potesse supportare alcuni metodi per collegare i post wiki della comunità tra i siti. Perché scommetto che questa domanda è stata posta su StackOverflow e penso anche che l'analisi statistica possa attrarre alcune persone che di solito non visitano SO.
Sharpie,

@Sharpie: ci sono stati diversi post SO interessanti come stackoverflow.com/questions/1295955/… o stackoverflow.com/questions/1535021/…, tuttavia non sono focalizzati sui pacchetti. e sono d'accordo, il collegamento del wiki della community potrebbe essere davvero utile.
Radek,

Risposte:



23

Uso plyr e ggplot2 di più su base giornaliera.

Faccio anche molto affidamento su pacchetti di serie storiche; soprattutto, il pacchetto zoo .


8

Uso il pacchetto xtable . Il pacchetto xtable trasforma le tabelle prodotte da R (in particolare, le tabelle che mostrano i risultati anova) in tabelle LaTeX, da includere in un articolo.


8

il multicore è piuttosto utile per lo strumento per rendere più veloci gli script più veloci.
cacheSweave consente di risparmiare molto tempo durante l'utilizzo Sweave.


8

ggplot2 - senza dubbio la migliore visualizzazione per R.

RMySQL / RSQLite / RODBC - per la connessione a un database

sqldf : manipola data.frames con query SQL

Hmisc / rms - pacchetti di Frank Harrell contenenti comode funzioni varie e simpatiche funzioni per le analisi di regressione.

GenABEL - bel pacchetto per studi di associazione su tutto il genoma

Rcmdr - una buona interfaccia grafica per R se ne hai bisogno.

Dai un'occhiata anche a CRANtastic: questo link ha un elenco dei pacchetti R più popolari. Molti in cima all'elenco sono già stati citati


8

data.table è il mio preferito ora! Attendo con impazienza la nuova versione con la lista dei desideri più implementata.



6

Personalmente, utilizzo principalmente i seguenti tre pacchetti, tutti disponibili dal fantastico Omega Project for Statistical Computing (non pretendo di essere un esperto, ma per i miei scopi sono molto facili da usare):

  • RCurl : Ha molte opzioni che consentono l'accesso ai siti Web che le funzioni predefinite nella base R avrebbero difficoltà con, penso che sia giusto dire. È un'interfaccia R per la libreria libcurl, che ha il vantaggio aggiuntivo di un'intera comunità al di fuori di R di svilupparla. Disponibile anche su CRAN .

  • XML : è molto indulgente nell'analisi di XML / HTML non valido. Si tratta di un'interfaccia R alla libreria libxml2 e ancora una volta ha il aggiunto a beneficio di una comunità tutta al di fuori di R svilupparla anche disponibile sul CRAN .

  • RJSONIO : consente di analizzare il testo restituito da una chiamata json e di organizzarlo in una struttura a elenco per ulteriori analisi. Il concorrente di questo pacchetto è rjson ma questo ha il vantaggio di essere vettorializzato, facilmente estendibile tramite S3 / S4, velocemente e scalabile a dati di grandi dimensioni.

6

Sweave ti consente di incorporare il codice R in un documento LaTeX. I risultati dell'esecuzione del codice, e facoltativamente del codice sorgente, diventano parte del documento finale.

Quindi, invece di, ad esempio, incollare un'immagine prodotta da R in un file LaTeX, puoi incollare il codice R nel file e conservare tutto in un unico posto.


4
Solo un suggerimento per tutti coloro che vogliono iniziare la ricerca riproducibile con R. Ti consiglierei di dare un'occhiata al pacchetto nuovo knitrinvece di Sweave. È fondamentalmente Sweave con steroidi. È facile, se non più facile, da imparare e molto più flessibile.
Christoph_J,


4

Trovo un reticolo insieme al libro di accompagnamento "Lattice: visualizzazione di dati multivariati con R" di Deepayan Sarkar inestimabile.


4

Se stai facendo qualsiasi tipo di modellazione predittiva, il cursore è una manna dal cielo. Specialmente combinato con il pacchetto multicore , sono possibili alcune cose piuttosto sorprendenti.


4

Di giorno in giorno il pacchetto più utile deve essere "straniero" che ha funzioni per la lettura e la scrittura di dati per altri pacchetti statistici come Stata, SPSS, Minitab, SAS, ecc. Lavorare in un campo in cui R non è un luogo comune significa che questo è un pacchetto molto importante.


3

Io uso

auto, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, rimodella, RODBC, TeachingDemos, XML.

Un sacco.


3

Non potrei vivere senza:

  • reticolo per la grafica
  • xlsx o XLConnect per la lettura di file Excel
  • RTF per creare report in formato RTF (preferirei Sword o R2WD ma non riesco a installare statconn al lavoro; sicuramente proverò presto odfWeave .)
  • nlme e lme4 per modelli misti
  • ff per lavorare con array di grandi dimensioni

2

RODBC per l'accesso ai dati dai database, sqldf per l'esecuzione di semplici query SQL su frame di dati (anche se mi sto forzando a utilizzare i comandi R nativi) e ggplot2 e plyr



2

Utilizziamo principalmente:

  • ggplot - per grafici
  • statistiche
  • e1071 - per SVM

Potresti anche voler controllare kernlab e il cursore per gli SVM. Sono alternative interessanti (non necessariamente migliori).
Zach,


2

Per me sto usando kernlab per Machine Learning Lab basato su kernel ed e1071 per SVM e ggplot2 per la grafica


2

Uso ggplot2, vegan e rimodella abbastanza spesso.



2

RColorBrewer non è stato menzionato qui, lo uso spesso per la stampa se ho bisogno di combinazioni di colori


2

Sono un grande fan di RCPP quando ho bisogno di un ciclo rapido per eseguire trattamenti non molto conformi. È molto ben implementato nel sistema R eco, può ricevere Matrix / Sparse Matrix senza conversione come argomenti in una funzione.

La sintassi C ++ è semplice quando si eseguono operazioni semplici (che è spesso il mio caso).

Davvero, non è necessario essere un produttore di pacchetti per aver bisogno di questa fantastica libreria.

Ho detto che C ++ è molto rapido?


2

I pacchetti doParallel e foreach hanno reso la mia vita molto più semplice permettendomi di parallelizzare il mio codice ed eseguirlo su un'istanza ottimizzata per il calcolo su Amazon EC2 ! Li uso molto spesso. Ma ciò non sarebbe stato possibile senza le AMI RStudio rilasciate da Louis Aslett. Infine, devo menzionare il pacchetto stringr che rende davvero il lavoro con le stringhe una passeggiata nel parco. Usalo in ogni applicazione di mining di testo. Inoltre, utilizzo spesso Knitr per produrre report di alta qualità sul mio lavoro. Mille grazie per questo fantastico pacchetto Yihui Xie!


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.