上QQ阅读APP看书,第一时间看更新
第2章 Spark 2.4技术及原理
Apache官方网站于2019年5月8日发布了Spark Release 2.4.3版本。Apache Spark 2.4.3版本是Spark 2.4系列上的第3个版本。Spark 2.2.0是Spark 2.2中第一个在生产环境可以使用的版本,对于Spark具有里程碑意义。Spark 2.4.X版本在Spark 2.2.X、Spark 2.3.X的基础上进行了改进。
Apache Spark 2.4.X版本的一些新变化如下。
Core and Spark SQL核心和Spark SQL。
Windows性能和稳定性。
Known Issues已知的问题。
Notable Changes显著变化。
如无特殊说明,本书所有内容都基于最新最稳定的Spark 2.4.3版本的源码编写,为体现Spark源码的演进过程,部分核心源码在Spark 1.5.X、Spark 1.6.X、Spark 2.2.X源码的基础上,新增Spark 2.4.3版本的源码,便于读者系统比对、研习Spark源码。