API / feed di dati disponibili come pacchetti in R


53

EDIT: la visualizzazione dell'attività CRAN di Web Technologies and Services contiene un elenco molto più completo di origini dati e API disponibili in R. È possibile inviare una richiesta pull su github se si desidera aggiungere un pacchetto alla visualizzazione attività.


Sto facendo un elenco dei vari feed di dati che sono già collegati a R o che sono facili da configurare. Ecco il mio elenco iniziale di pacchetti e mi chiedevo cos'altro mi manca.

Sto cercando di limitare questo elenco a feed di dati / API "in tempo reale" o "quasi in tempo reale", in cui i dati sottostanti potrebbero cambiare tra i download. Ci sono molti elenchi disponibili per set di dati statici, che richiedono solo un download.

Questo elenco è attualmente distorto verso i dati finanziari / delle serie temporali e potrei usare un po 'di aiuto per espanderlo in altri domini.

Free Data:
Data Source - Pacchetto
dati storici di Google Finanza - quantmod
Google Finanza bilanci - quantmod
dati storici di Yahoo Finanza - quantmod
dati storici di Yahoo Finanza - Tseries
Yahoo Finance catena opzioni correnti - quantmod
Yahoo Finanza stime degli analisti storico - fImport
Yahoo Finanza chiave corrente statistiche - fImport - sembra essere rotto
OANDA storici tassi di cambio / prezzi dei metalli - quantmod
FRED indicatori macroeconomici storici - quantmod
World Bank indicatori macroeconomici - WDI
Dati storici del volume di ricerca di Google Trends - RGoogleTrends
Google Docs - RGoogleDocs
Google Storage - RGoogleStorage
Twitter - twitteR
Zillow - Zillow
New York Times - RNYTimes
US Censimento 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - richiede account gratuito
Factual.com - addressual
Geocode RDSTK
Coordinate della mappa ai confini politici - RDSTK
Weather Underground - Crea il tuo
Google News - rotolare il proprio
Scienze della Terra netCDF dati - rotolare il proprio
dati climatici - rotolare il proprio
dati sanitari pubblici - rotolare il proprio
OAI Harvester - Open Archives Initiative mietitrice
RAmazonS3 - server di archiviazione S3 di Amazon
Rflikr - Flikr api

Richiede un abbonamento:
Bloomberg - RBloomberg
LIM - LIM
Trades and Quotes from NYSE - RTAQ
Interactive Brokers - IBrokers


1
dipende da cosa intendi per "facile da configurare" ... Ho un numero di script personalizzati che sono "facili da configurare"
David LeBauer,

2
In questo momento sto definendo "facile da configurare" come "esiste il pacchetto" o "qualcuno ha pubblicato / pubblicato una funzione per scaricare i dati"
Zach

Definirei ulteriormente "i pacchetti esiste" come "il pacchetto è su CRAN" o "il pacchetto è su R Forge", "il pacchetto è su un repository pubblico simile a CRAN".
Zach,

Aggiunta: API del registro federale (nelle opere).
P.

Questo thread può anche essere di interesse: Import prezzo delle azioni da Yahoo Finance in R .
gung - Ripristina Monica

Risposte:


8
  1. Le istruzioni per l'uso di R per scaricare i dati netCDF sono disponibili qui , un formato comune utilizzato per la memorizzazione dei dati delle scienze della Terra, ad esempio come nei dati geospaziali marini di OpenEarth o driver del modello climatico e previsioni da UCAR

  2. rnpn (in fase di sviluppo) consente di ottenere dati dalla National Phenology Network, un progetto di scienza dei cittadini per tenere traccia dei tempi di rinnovamento , fioritura e senescenza delle piante. Vedi il post sul blog dello sviluppatore .

  3. -obsolete- RClimate fornisce strumenti per scaricare e manipolare dati climatici su file flat (con esercitazioni, anche qui -

  4. Scarica dati finanziari storici con tseries::get.hist.quote

  5. Documenti di Michael Samuel che scaricano dati sulla salute pubblica

  6. raster::getData fornisce l'accesso alle variabili climatiche tramite worldclim


Che cosa sono i "dati netCDF"?
Zach,

@Zach NetCDF è un tipo di modo strutturato universale di archiviare set di dati di grandi dimensioni. Un approccio alternativo si basa sul formato HDF5 .
chl

@David (+1) Mille grazie per il quarto punto!
chl

Cosa è successo a RClimate? Non riesco a trovare il pacchetto da nessuna parte
Daniel Ryback,

ora c'è una libreria ncdf4 su R per gestire netcdf4. È più complicato da installare rispetto a ncdf, ma penso che la versione successiva sia obsoleta. Alcuni anni fa sono persino riuscito a installare netcdf4 con Min GW64 per far funzionare questo pacchetto su Windows :) se l'ho fatto, significa che è fattibile ... e sembra che D. Pierce (autore del pacchetto) stia fornendo fonti sul suo sito web cirrus.ucsd.edu/~pierce/ncdf
robin girard

8

Esiste un progetto volto a creare pacchetti R con questo obiettivo (interfaccia R per API in tempo reale) chiamato rOpenSci , che ha 18 pacchetti attualmente disponibili o in fase di sviluppo. Alcuni (rnpn, rfishbase) sono già nella tua lista.

Ottima lista! e divulgazione completa - Faccio parte del progetto rOpenSci.


1
  1. ONETr - interazione efficiente con l'API O * NET ™, che offre dati descrittivi occupazionali dal Dipartimento del Lavoro degli Stati Uniti.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.