Gestione di insiemi di dati di grandi dimensioni in R - tutorial, best practice, ecc


11

Sono un Noob R che è tenuto a fare vari tipi di analisi su grandi set di dati in R. Quindi, mentre mi guardo attorno a questo sito e altrove, mi è sembrato che ci siano molti problemi esoterici e meno noti coinvolti qui - come quale pacchetto usare quando, quali trasformazioni da (non) applicare ai dati ecc.

Mi chiedo solo se esiste un libro / tutorial / guida che demistifica tutto questo e presenta le informazioni in modo sistematico? Preferisco farlo invece di guardarmi intorno e raccogliere informazioni da diverse fonti online.

Grazie in anticipo.



1
Potrebbe essere utile condividere alcuni esempi del tipo di analisi che si desidera fare e l'aspetto dei dati. Statistiche semplici come mezzi o regressioni complesse? 200 variabili in mille righe o 4 variabili e 20 milioni di righe?
PaulHurleyuk,

1
Se hai set di dati veramente "grandi", dovresti forse dare un'occhiata ai database relazionali. Un punto di partenza per questo può essere il manuale "R Import / Export dei dati" fornito con RNB. Il manuale è disponibile anche tramite la sezione "Manuali" del sito Web R.

1
In primo luogo, domanda importante: Che cosa si intende per grandi, e che cosa vuoi fare?
Fomite,

Risposte:


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.