全部產品
Search
文件中心

Realtime Compute for Apache Flink:2025-06-04版本

更新時間:Jul 01, 2025

本文介紹2025年6月4日發布的Realtime ComputeFlink版的重大功能變更和主要缺陷修複。

重要

本次升級計劃在全網分步驟完成灰階,具體升級計劃,請關注Realtime Compute控制台頁面右側的最新公告。如果您不能使用相關新功能,說明您的帳號暫未完成灰階。如果您需要儘快升級,請提交工單告知我們,我們將結合實際情況進行安排。

概述

2025年6月4日正式對外發布Realtime ComputeFlink版新版本,包含平台升級、引擎更新、連接器更新、效能最佳化以及缺陷修複。

平台側

本次平台功能更新聚焦於提升使用體驗和營運效率。以下是本次更新亮點:

  • 支援對接Git:支援對接GitHub、GitLab和Gitee遠程倉庫,最佳化代碼版本管理流程,提升團隊協作效率。

  • 平台資訊支援對接到SLS:支援將作業開機記錄、運行事件及資源用量等資料持久化儲存至SLS,便於進行歷史資料查詢與審計。

  • 日誌頁面體驗最佳化:最佳化日誌輸出配置,支援可視化操作配置,降低誤操作風險。

  • CloudMonitor警示體驗最佳化:警示通知內容中新增作業名稱展示,便於快速定位異常作業。

引擎側

引擎側正式發布VVR 11.1版本。該版本基於Apache Flink 1.20.1核心深度定製,在繼承社區能力的基礎上進行了最佳化和增強。主要變更涵蓋以下維度:

升級說明

請參見作業引擎版本升級VVR版本號碼變更策略

不相容改動說明

  • Java SDK將預設採用JDK 11作為標準運行時環境,並正式終止對JDK 8版本的支援。Jar作業需使用JDK 11重新編譯打包,SQL作業不受影響。

  • Hologres連接器最佳化系統架構,對部分歷史參數進行了調整與移除。

全新能力

  • 大模型即時向量構建與推理。

    • 向量構建:深度整合百鍊大模型,實現流式資料即時向量化,支撐推薦系統、智能搜尋的即時特徵計算。

    • 文本推理:基於預訓練模型實現文本摘要、機器翻譯等動態內容產生功能,支援業務情境的智能化文本處理。

能力增強

  • 物化表支援定時回刷:支援Paimon物化表的定時回刷,能夠按設定周期自動重新整理整個鏈路的資料。

  • StarRocks維表即時Join:新增Flink與StarRocks維表的即時關聯能力。

  • SLS CDC與Paimon模式演化:YAML CDC新增對SLS資料來源的支援,並實現SLS到Paimon的Schema自動演化,簡化資料湖倉情境中中繼資料管理複雜度。

  • 資料攝入升級至Flink CDC 3.4:包含該版本的核心能力,增強資料擷取功能體系。

  • 資料攝入支援SLS Source:實現SLS到Paimon的資料流轉及Schema動態演化功能。

  • 資料攝入支援MaxCompute Sink:資料攝入功能新增MaxCompute Sink,支援TB級以上大規模資料寫入。

  • FlinkSQL 集合操作最佳化:UNION ALL查詢調試結果可以保留欄位別名。

效能提升

  • PostgreSQL CDC全量資料讀取最佳化:最佳化PostgreSQL CDC資料切片機制,採用非同步切片與資料讀取平行處理模式,顯著提升全量資料讀取效能。

  • 雲資料庫Tair(Redis開源版)緩衝策略最佳化:支援按天或固定時間段配置緩衝更新黑名單,避免高峰期資源競爭,提升快取服務的穩定性。

體驗最佳化

Source/Sink資料量透出:支援監控Source和Sink任務的輸入輸出資料量,以協助驗證資料的完整性並進行作業調優。

安全提升

  • 雲資料庫Tair(Redis開源版) 支援TLS/SSL串連:增強連接器安全性,支援TLS/SSL加密串連模式,滿足金融、政務等高安全等級情境的接入要求。

  • Parquet安全性漏洞修複:升級Apache Parquet至1.15.1,修複Avro格式還原序列化遠程代碼執行漏洞,消除資料處理環節的潛在安全風險。

  • MaxCompute身份標識上報:上報applicationName至MaxCompute服務端,以便精準追蹤Flink作業對第三方服務的資源佔用,從而提升跨系統資源訪問的可審計性。

功能介紹

特性

詳情

相關文檔

支援對接Git

Realtime Compute開發控制台支援對接GitHub、GitLab和Gitee遠程倉庫,支援拉取推送SQL代碼和作業配置等基礎操作,並內建衝突解決機制。

Git整合(公測中)

支援訊息投遞到SLS

支援將目標專案空間下的作業開機記錄、運行事件及資源用量等資料投遞到SLS。

訊息投遞

日誌配置頁面體驗最佳化

在作業營運中,作業日誌可以通過介面配置,將日誌資訊輸出至其他資料存放區(例如SLS、OSS或Kafka)。

配置作業日誌輸出

資料攝入支援MaxCompute Sink

支援MaxCompute連接器用於資料攝入YAML作業的開發,作為目標端進行資料寫入。

MaxCompute

資料攝入功能最佳化

converter-after-transform參數新增FIELD_NAME_LOWER_CASE轉換器類型,自動將源表大寫欄位轉為小寫,減少資料清洗預先處理步驟。

資料攝入開發參考

Elasticsearch連接器最佳化

允許欄位為NULL時不覆蓋ES已有資料,保留下遊儲存的欄位值,增強資料寫入的魯棒性。

Elasticsearch

Hologres連接器最佳化

為最佳化系統架構、提升維護效率,對部分歷史參數進行了調整與移除。不同版本在功能實現和使用方式上存在差異,請根據實際使用的VVR版本,參考對應配置文檔進行適配,確保作業相容性與運行穩定。

MongoDB連接器最佳化

新增ignore.delete-events.enabled參數,支援在CDC過程中過濾MongoDB的Delete事件,減少無效資料同步壓力,最佳化增量同步處理效率。

MongoDB

Mysql連接器最佳化

修改property-version參數預設值為1。

管理MySQL Catalog

Kafka連接器最佳化

  • 新增canal-json.infer-schema.strategy參數,提供解析表結構時的解析策略,可通過解析JSON資料自動解析,或通過canal json資料中的sqlType數組解析。

  • 新增json.decode.parser-table-id.fields參數,支援解析JSON資料產生表結構欄位。

  • 資料攝入結果表Debezium JSON格式新增debezium-json.include-schema.enabled參數,檢測Debezium JSON訊息是否包含Schema資訊。

訊息佇列Kafka

RocketMQ連接器最佳化

新增deliveryTimestampMode相關的定時訊息發送策略參數,支援靈活配置觸發規則,提升訊息系統在時序任務中的控制能力。

雲訊息佇列 RocketMQ 版

雲資料庫Tair(Redis開源版)連接器最佳化

  • 緩衝策略ALL模式支援讀取多值hashmap類型資料。

  • 新增cacert.filepath參數,支援資料鏈路TLS/SSL加密模式。

  • cacheReloadTimeBlackList參數支援定時每日時間段。

雲資料庫Tair(Redis開源版)

StarRocks連接器最佳化

  • 支援相容的列類型變更。

  • 新增Flink與StarRocks維表的即時關聯能力,滿足複雜即時分析情境中維表資料的動態關聯需求。

Paimon連接器最佳化

  • 支援通過PARSE_JSONTRY_PARSE_JSON內建函數寫入和消費VARIANT類型的資料,提升JSON資料查詢以及處理效能。

AnalyticDB PostgreSQL版(ADB PG)連接器最佳化

writeMode參數新增COPY模式。

雲原生資料倉儲AnalyticDB PostgreSQL版(ADB PG)

物化表最佳化

  • 支援修改物化表SQL查詢和連接器參數。

  • 支援建立物化表的工作流程,執行循環性調度,以實現定時回刷功能。

FlinkSQL支援Hive Kerberos認證

支援通過SQL安全訪問Hive資料,整合Kerberos認證協議,實現用戶端與服務端的雙向身分識別驗證及加密傳輸,有效防止資料竊取與越權訪問。

PyFlink Docker鏡像升級

升級PyFlink的基礎Docker鏡像,提高了對不同Python版本和glibc版本的相容性。

暫無。

視窗函數最佳化

支援Flink 1.20版本全新的SESSION WINDOW行為,相較於VVR 8.x版本SESSION WINDOW(建議棄用)與彙總語句耦合的強制要求,該版本提供了更為靈活的使用情境。

視窗彙總

SelectDB正式內建

從公測版本正式迭代為穩定高效的內建版本。

SelectDB

Table API作業最佳化

Table API作業支援通過SQL文本方式調用內建函數。

支援的函數

大模型即時向量構建與推理

  • 支援AI模型的DDL資料定義語句。

  • 支援AI函數ML_PREDICT,在Realtime Compute中使用模型對資料進行推斷。

  • 支援對接百鍊大模型。

主要缺陷修複

連接器缺陷修複

  • 修複SLS新架構逸出字元。

  • 修複RocketMQ延遲Topic訊息丟失問題。

  • 修複雲資料庫Tair(Redis開源版)雙庫寫入衝突問題。

  • 修複Hologres維表JOINnull 指標異常。

  • 修複Paimon主鍵表寫入。

  • 修複Lindorm維表JOIN只能匹配一行的問題。

SQL及轉換缺陷修複

  • 修複YAML轉換操作符,解決Calcite解析器未識別字串比較操作符導致的編譯錯誤。

  • 修複CTAS作業Schema合并衝突。

  • 修複Hive Catalog訪問非Hive表的許可權限制問題。

穩定性及效能最佳化

  • 修複Paimon Sink關閉階段耗時過長問題。

  • 修複表過濾異常,支援debezium.table.exclude.list參數繞行。

  • 修複Minibatch導致的資料不一致問題。

  • 修複PyFlink Table API對VVR內建函數的調用相容性問題。