Domande taggate «delta-lake»

Apache Spark: impatto di ripartizionamento, ordinamento e memorizzazione nella cache su un join

Sto esplorando il comportamento di Spark quando mi unisco a un tavolo. Sto usando Databricks. Il mio scenario fittizio è: Leggi una tabella esterna come dataframe A (i file sottostanti sono in formato delta) Definire il frame di dati B come frame di dati A con solo determinate colonne selezionate …

10 apache-spark pyspark bigdata azure-databricks delta-lake

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.

Licensed under cc by-sa 3.0 with attribution required.