本文為您介紹2026年04月15日發布的EMR Serverless Spark的功能變更。
概述
2026年04月15日,我們正式對外發布 Serverless Spark 新版本,包括平台管理、效能最佳化以及引擎能力。
平台側
功能分類 | 功能更新說明 | 相關文檔 |
資料目錄 | 新增支援對接StarRocks。使用者可以在資料目錄中添加StarRocks,實現對相關資料的訪問和查詢。 | |
通過Livy提交的任務支援訪問資料目錄中已添加的所有DLF Catalog,簡化多資料來源情境下的任務配置流程。 | ||
資料開發 | 支援設定任務優先順序,使用者可以為關鍵業務任務配置更高的優先順序,確保重要任務在資源緊張時優先獲得調度,保障核心業務穩定運行。 說明 該功能僅限白名單隊列使用。如需開通使用,請提交工單聯絡 Serverless Spark 團隊。 | |
AI中心 | AI Function 新增支援qwen3.5-plus、qwen3.6-plus、tongyi-embedding-vision-plus模型,拓展多模態資料處理能力,支援圖片、視頻、文本等多種輸入模態的推理與向量化以及智能分析。 | |
會話管理 | 新增支援DuckDB會話,使用者可以在平台中直接使用DuckDB進行輕量級資料查詢與分析,適用於互動式探索和中小規模資料集的快速分析情境。 | |
叢集管理 | 新增Ray叢集資源形態,支援使用者建立和管理Ray叢集,滿足多模態資料處理,以及分布式 Python 並行計算。 | |
Skills | 新增發布 EMR Serverless Spark 管理 Skill,使用者可通過自然語言互動方式完成工作空間管理及 Spark 作業的提交、查詢與管理操作,降低使用門檻,提升資料開發效率。 | |
其餘最佳化 | SparkSQL查詢結果支援雙擊/右鍵快捷複製。 |
引擎側
版本號碼 | 說明 |
esr-5.2.0 (Spark 4.0.1, Scala 2.13) esr-4.8.0 (Spark 3.5.2, Scala 2.12) esr-3.7.0 (Spark 3.4.4, Scala 2.12) |
|
Ray引擎 err-1.0.0 (Ray 2.47.1, Python 3.12) |
|
Celeborn |
|