Apache Spark 2.3.0 正式发布,这也是 2.x 系列中的第四个版本。此版本增加了对 Structured
Streaming 中的 Continuous Processing 以及全新的 Kubernetes Scheduler
后端的支持。其他主要更新包括新的 DataSource 和 Structured Streaming v2 API,以及一些 PySpark
性能增强。 此外,此版本继续针对项目的可用性、稳定性进行改进,并持续润色代码。 各项更新具体细节,请查阅发行说明: 下载地址: |