本文为您介绍2026年04月15日发布的EMR Serverless Spark的功能变更。
概述
2026年04月15日,我们正式对外发布 Serverless Spark 新版本,包括平台管理、性能优化以及引擎能力。
平台侧
功能分类 | 功能更新说明 | 相关文档 |
数据目录 | 新增支持对接StarRocks。用户可以在数据目录中添加StarRocks,实现对相关数据的访问和查询。 | |
通过Livy提交的任务支持访问数据目录中已添加的所有DLF Catalog,简化多数据源场景下的任务配置流程。 | ||
数据开发 | 支持设置任务优先级,用户可以为关键业务任务配置更高的优先级,确保重要任务在资源紧张时优先获得调度,保障核心业务稳定运行。 说明 该功能仅限白名单队列使用。如需开通使用,请提交工单联系 Serverless Spark 团队。 | |
AI中心 | AI Function 新增支持qwen3.5-plus、qwen3.6-plus、tongyi-embedding-vision-plus模型,拓展多模态数据处理能力,支持图片、视频、文本等多种输入模态的推理与向量化以及智能分析。 | |
会话管理 | 新增支持DuckDB会话,用户可以在平台中直接使用DuckDB进行轻量级数据查询与分析,适用于交互式探索和中小规模数据集的快速分析场景。 | |
集群管理 | 新增Ray集群资源形态,支持用户创建和管理Ray集群,满足多模态数据处理,以及分布式 Python 并行计算。 | |
Skills | 新增发布 EMR Serverless Spark 管理 Skill,用户可通过自然语言交互方式完成工作空间管理及 Spark 作业的提交、查询与管理操作,降低使用门槛,提升数据开发效率。 | |
其余优化 | SparkSQL查询结果支持双击/右键快捷复制。 |
引擎侧
版本号 | 说明 |
esr-5.2.0 (Spark 4.0.1, Scala 2.13) esr-4.8.0 (Spark 3.5.2, Scala 2.12) esr-3.7.0 (Spark 3.4.4, Scala 2.12) |
|
Ray引擎 err-1.0.0 (Ray 2.47.1, Python 3.12) |
|
Celeborn |
|