Apache Spark SQL è uno strumento per "SQL e elaborazione di dati strutturati" su Spark, un sistema di cluster computing veloce e generico. Può essere utilizzato per recuperare dati da Hive, Parquet, ecc. Ed eseguire query SQL su RDD e set di dati esistenti.