Flink 機能リリースノート (2025年6月4日) - Realtime Compute for Apache Flink

このトピックでは、2025年6月4日にリリースされた Realtime Compute for Apache Flink の主要な機能変更とバグ修正について説明します。

重要

バージョンアップグレードはユーザーに段階的にリリースされます。詳細については、「Realtime Compute for Apache Flink コンソール」の最新のお知らせをご参照ください。このバージョンの新機能は、アカウントのアップグレードが完了した後にのみ使用できます。迅速なアップグレードを申請するには、チケットを送信してください。

概要

このリリースには、プラットフォーム、エンジン、コネクタの更新、パフォーマンスの最適化、バグ修正が含まれています。

プラットフォームの更新

プラットフォームの更新は、ユーザーエクスペリエンスと O&M 効率に重点を置いています。ハイライト：

Git 統合： GitHub、GitLab、Gitee リモートリポジトリと統合し、コードバージョン管理を最適化し、チームコラボレーションの効率を向上させます。
SLS 統合： ジョブ起動ログ、ランタイムイベントログ、リソース使用状況データを Alibaba Cloud Simple Log Service (SLS) に永続化し、履歴データのクエリと監査を行います。
ジョブログエクスペリエンスの最適化： ログ出力構成を最適化し、視覚化された操作と構成をサポートし、誤操作のリスクを軽減します。
CloudMonitor アラートエクスペリエンスの最適化： アラート通知にジョブ名を表示し、異常なジョブの識別を容易にします。

エンジンの更新

Ververica Runtime (VVR) バージョン 11.1 が正式にリリースされました。 Apache Flink 1.20.1 上に構築された VVR 11.1 は、追加の最適化と機能強化を提供します。ハイライト：

アップグレード前に

詳細については、「デプロイメントのエンジンバージョンをアップグレードする」および「VVR バージョン番号戦略」をご参照ください。

非互換の変更

Java SDK：JDK 11 が標準ランタイム環境になりました。 JDK 8 のサポートは正式に終了しました。 JDK 8 でコンパイルされた JAR ジョブの場合は、JDK 11 を使用してプログラムを再コンパイルし、再パッケージ化してください。 SQL ジョブは影響を受けません。
Hologres コネクタ：Hologres コネクタはアーキテクチャの最適化が行われ、一部のコネクタオプションが変更または削除されました。

新機能

LLM によるリアルタイムベクトル化と推論
- ベクトル構築：Alibaba Cloud Model Studio と統合してストリーミングデータをリアルタイムでベクトル化し、レコメンデーションシステムとインテリジェント検索のリアルタイム機能計算をサポートします。
- テキスト推論：事前学習済みモデルを使用して要約、翻訳、その他のコンテンツを動的に生成し、ビジネスユースケースのインテリジェントテキスト処理をサポートします。

機能強化

マテリアライズドテーブルの履歴データのスケジュールバックフィル：スケジュールに基づいてマテリアライズドテーブルのデータをバックフィルすることをサポートします。
StarRocks ディメンションテーブルとのリアルタイムルックアップ結合の実行
SLS CDC および SLS-Paimon スキーマ進化：YAML CDC は、SLS データソースと SLS から Paimon への自動スキーマ進化をサポートし、データレイクハウスシナリオでのメタデータ管理を簡素化します。
データ取り込みエンジンが Flink CDC バージョン 3.4 にアップグレードされました：Flink CDC バージョン 3.4 のコア機能をサポートし、データキャプチャ機能が強化されています。
YAML 経由の SLS からのデータ取り込みの取り込み：SLS から Paimon へのデータ取り込みとスキーマ進化をサポートします。
YAML 経由の MaxCompute へのデータの取り込み：最大 1 テラバイトのデータを MaxCompute に取り込みます。
Flink SQL の集合演算の最適化：UNION ALLを含むドラフトのデバッグ結果でフィールドエイリアスを保持することをサポートします。

パフォーマンスの向上

PostgreSQL CDC コネクタのスナップショット読み取りパフォーマンスの向上：非同期セグメンテーションと並列読み取りを特徴とする最適化されたデータセグメンテーションメカニズムを実装し、スナップショット読み取りパフォーマンスを大幅に向上させます。
Tair (Redis OSS 互換) コネクタのキャッシュポリシーの強化：時間ベースのキャッシュ無効化機能をサポートし、ユーザーはキャッシュの非アクティブ化の日または期間を指定できます。これにより、ピーク時のリソース競合を防ぎ、全体的なキャッシュの安定性が向上します。

エクスペリエンスの最適化

入出力ボリュームの追跡：ソースおよびシンクオペレーターでの入出力ボリュームを監視し、ユーザーがデータの整合性を検証し、ジョブのパフォーマンスを最適化できるようにします。

セキュリティの強化

Tair (Redis OSS 互換) コネクタのセキュリティ強化：Tair (Redis OSS 互換) コネクタは TLS/SSL 接続をサポートするようになり、安全なデータ通信が可能になりました。この強化は、金融や政府サービスなど、セキュリティ要件が厳しい業界にとって有益です。
Apache Parquet の脆弱性の修正：Apache Parquet を 1.15.1 にアップグレードし、Parquet 形式でのデータ逆シリアル化に関連するリモートコード実行 (RCE) の脆弱性を修正しました。この更新により、Parquet を使用したデータ処理における潜在的なセキュリティリスクが軽減されます。
MaxCompute ID レポート：このサービスは、applicationName を MaxCompute サーバーにレポートすることをサポートするようになり、サードパーティサービスが Flink ジョブによるリソース使用状況を正確に追跡できるようになりました。これにより、システム間のリソースアクセスにおける監査能力が向上します。

機能

機能	説明	参照
Git リポジトリとの統合	SQL コードとジョブ構成のリモート Git リポジトリ (GitHub、GitLab、Gitee) との双方向同期をサポートし、組み込みの競合解決メカニズムを備えています。	詳細については、「Git と統合する (パブリックプレビュー)」をご参照ください。
SLS へのメッセージの配信	ジョブ起動ログ、ランタイムイベント、リソース使用状況データを SLS に配信します。	詳細については、「メッセージを配信する」をご参照ください。
ログ構成ページのエクスペリエンスの最適化	コンソールでジョブログを他のデータストア (SLS、OSS、Kafka など) にエクスポートします。	詳細については、「デプロイメントのログをエクスポートするためのパラメータを構成する」をご参照ください。
YAML 経由で MaxCompute にデータを取り込む	YAML で開発されたジョブのデータ取り込みシンクとして MaxCompute コネクタを使用することをサポートします。	詳細については、「MaxCompute コネクタ」をご参照ください。
データ取り込みの最適化	`converter-after-transform` オプションは、`FIELD_NAME_LOWER_CASE` コンバータータイプをサポートするようになり、ソーステーブルの大文字のフィールド名を自動的に小文字に変換し、クレンジングフェーズ中のデータ前処理を合理化します。	詳細については、「データ取り込み開発リファレンス」をご参照ください。
Elasticsearch コネクタの最適化	Elasticsearch テーブルを更新するときに null 値を無視することをサポートし、データ書き込みの堅牢性を強化します。	詳細については、「Elasticsearch コネクタ」をご参照ください。
Hologres コネクタの最適化	システムアーキテクチャを最適化し、メンテナンス効率を向上させるために、一部のコネクタオプションを調整および削除します。機能の実装と使用方法は、使用している VVR バージョンによって異なります。ジョブの互換性と運用安定性を確保するために、使用している VVR バージョンに固有のドキュメントを参照してください。	詳細については、「Hologres コネクタ」をご参照ください。詳細については、「コネクタオプション (VVR 11 以降)」をご参照ください。詳細については、「コネクタオプション (VVR 8 以前)」をご参照ください。
MongoDB コネクタの最適化	`ignore.delete-events.enabled` オプションを追加して、変更データキャプチャ中に MongoDB `delete` イベントのフィルタリングをサポートし、データ同期の負荷を軽減し、増分同期の効率を向上させます。	詳細については、「MongoDB コネクタ」をご参照ください。
MySQL コネクタの最適化	property-version オプションのデフォルト値が 1 に変更されました。	詳細については、「MySQL カタログを管理する」をご参照ください。
Kafka コネクタの最適化	`canal-json.infer-schema.strategy` オプションをサポートし、スキーマ解析ポリシーを構成できます。 Canal JSON データの JSON データまたは sqlType フィールドに基づいてスキーマを解析することを選択できます。 `json.decode.parser-table-id.fields` オプションを追加して、JSON データを解析してテーブルスキーマフィールドを生成することをサポートします。データ取り込みのためにシンク固有のオプション `debezium-json.include-schema.enabled` をサポートし、Debezium JSON メッセージにスキーマ情報が含まれているかどうかを確認します。	詳細については、「Kafka コネクタ」をご参照ください。
ApsaraMQ for RocketMQ コネクタの最適化	`deliveryTimestampMode` などのコネクタオプションを追加し、スケジュールに従ってメッセージを配信し、トリガー規則を柔軟に構成できます。これにより、時系列タスクのメッセージキューシステムの使用をきめ細かく制御できます。	詳細については、「ApsaraMQ for RocketMQ」をご参照ください。
Tair (Redis OSS 互換) コネクタの最適化	`cache` が `ALL`に設定されている場合、キーに対して複数の値を持つハッシュマップの読み取りをサポートします。 `cacert.filepath` オプションを追加して、データリンクの TLS/SSL 暗号化をサポートします。 `cacheReloadTimeBlackList` オプションを追加して、毎日の特定の期間中にキャッシュを無効にします。	詳細については、「Tair (Redis OSS 互換) コネクタ」をご参照ください。
StarRocks コネクタの最適化	互換性のある列タイプの変換をサポートします。 StarRocks ディメンションテーブルとのリアルタイムルックアップ結合をサポートし、複雑なリアルタイム分析シナリオを実現します。	詳細については、「StarRocks コネクタ」をご参照ください。詳細については、「サポートされているコネクタ」をご参照ください。
Paimon コネクタの最適化	PARSE_JSON 関数と TRY_PARSE_JSON 関数を使用して `VARIANT` データの書き込みと使用をサポートし、JSON データのクエリと処理のパフォーマンスを向上させます。	詳細については、「Paimon テーブルにデータを書き込み、Paimon テーブルからデータを使用する」をご参照ください。
AnalyticDB for PostgreSQL コネクタの最適化	`writeMode` オプションは `COPY` モードをサポートします。	詳細については、「AnalyticDB for PostgreSQL コネクタ」をご参照ください。
マテリアライズドテーブルの最適化	マテリアライズドテーブルの SQL クエリとコネクタオプションの変更をサポートします。定期的なスケジューリングとデータバックフィルのためのマテリアライズドテーブルのワークフローの作成をサポートします。	詳細については、「マテリアライズドテーブルを作成および使用する」をご参照ください。詳細については、「ワークフローを管理する」をご参照ください。
Hive Kerberos 認証の Flink SQL サポート	SQL を介して Kerberos 化されたクラスタ内の Hive データに安全にアクセスします。これにより、クライアントとサーバー間の双方向 ID 検証と暗号化伝送が保証され、データの盗難と不正アクセスを効果的に防ぎます。	詳細については、「Kerberos 化された Hive クラスタを登録する」をご参照ください。詳細については、「SQL デプロイメントの概要」をご参照ください。
PyFlink Docker イメージのアップグレード	PyFlink の基本 Docker イメージがアップグレードされ、さまざまな Python および glibc バージョンとの互換性が向上しました。
ウィンドウ関数の最適化	Apache Flink バージョン 1.20 の改善された SESSION WINDOW の動作をサポートします。これは、集計ステートメントとの結合が必要な VVR バージョン 8.x の SESSION WINDOW と比較して柔軟性が向上しています。これらの機能強化を活用するために、最新バージョンにアップグレードすることをお勧めします。	詳細については、「ウィンドウ集計」をご参照ください。
SelectDB コネクタの組み込みサポート	SelectDB コネクタはパブリックプレビューを完了し、Realtime Compute for Apache Flink の組み込みコネクタとして正式にリリースされました。	詳細については、「SelectDB」をご参照ください。
Table API ジョブの最適化	Table API クエリで組み込み関数を呼び出すことをサポートします。	詳細については、「サポートされている関数」をご参照ください。
LLM を利用したリアルタイムベクトル化と推論	AI モデルのデータ定義言語 (DDL) ステートメントを導入します。 `ML_PREDICT` 関数を追加し、リアルタイム計算で AI モデルを使用して推論を行います。 Alibaba Cloud Model Studio と統合します。	詳細については、「モデル DDL」をご参照ください。詳細については、「ML_PREDICT」をご参照ください。詳細については、「Alibaba Cloud Model Studio と統合する」をご参照ください。

主なバグ修正

コネクタ

以下の問題を修正しました。

SLS コネクタが新しいアーキテクチャを使用してエスケープ文字を使用すると、Null が返されます。
遅延した ApsaraMQ for RocketMQ トピックでメッセージが失われました。
2 つの Tair (Redis OSS 互換) データベースへの同時書き込み中に競合が発生しました。
Hologres ディメンションテーブルとのルックアップ結合中に NullPointerException エラーが発生しました。
プライマリキーを使用して Paimon テーブルにデータを書き込むときに IllegalStateException エラーが発生しました。
Lindorm ディメンションテーブルとのルックアップ結合中に 1 行のみが一致します。

SQL と変換

以下の問題を修正しました。

YAML 変換演算子の問題、具体的には、Calcite パーサーが文字列比較演算子を認識しないことによって発生するコンパイルエラー。
CTAS を使用したスキーマ統合中に競合が発生しました。
Hive カタログ内の Hive 以外のテーブルへのアクセスが拒否されました。

安定性とパフォーマンス

以下の問題を修正しました。

Paimon シンクのクローズに時間がかかりすぎました。
テーブルフィルタリングの例外。これらは、debezium.table.exclude.list オプションを使用してバイパスできます。
MiniBatch によってデータに不整合が生じました。
PyFlink Table API と Realtime Compute for Apache Flink の組み込み関数間の非互換性の問題。