Domande taggate «parquet»


1
Quali sono le differenze tra piuma e parquet?
Entrambi sono formati di archiviazione colonnari (su disco) da utilizzare nei sistemi di analisi dei dati. Entrambi sono integrati in Apache Arrow ( pacchetto pyarrow per python) e sono progettati per corrispondere ad Arrow come livello di analisi in memoria colonnare. In cosa differiscono entrambi i formati? Dovresti sempre preferire …

7
Avro vs. Parquet
Ho intenzione di utilizzare uno dei formati di file hadoop per il mio progetto relativo a hadoop. Ho capito parquet è efficace per la query colonna based e Avro per scansione completa o quando abbiamo bisogno di tutti i dati colonne! Prima di procedere e scegliere uno dei formati di …
92 hadoop  avro  parquet 

5
Parquet vs ORC vs ORC con Snappy
Sto eseguendo alcuni test sui formati di archiviazione disponibili con Hive e sto utilizzando Parquet e ORC come opzioni principali. Ho incluso ORC una volta con la compressione predefinita e una volta con Snappy. Ho letto molti documenti che affermano che Parquet è migliore in termini di complessità tempo / …
88 hadoop  hive  parquet  snappy  orc 
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.