このトピックでは、2026年1月9日にリリースされた Realtime Compute for Apache Flink の主な機能変更と主要なバグ修正について説明します。
このバージョンアップグレードは、ユーザーに段階的にリリースされます。詳細については、Realtime Compute for Apache Flink コンソールの最新のお知らせをご参照ください。このバージョンの新機能は、ご利用のアカウントのアップグレードが完了した後にのみ使用できます。アップグレードの迅速化を申請するには、してください。
概要
2026年1月9日、Realtime Compute for Apache Flink は新しいエンジンバージョンである Ververica Runtime (VVR) 11.5.0 を正式にリリースしました。今回のアップグレードでは、YAML 設定による複雑なシナリオに対応するための Flink Change Data Capture (CDC) の柔軟性の最適化、ストリーミングデータレイクハウスにおける Paimon のパフォーマンス向上、そして待望の Bitmap 型のネイティブサポートの導入に重点を置いています。さらに、このリリースでは、PolarDB-X、OceanBase、MongoDB などの主要なコネクタに対する大幅な機能強化と安定性の修正が提供され、大規模なデータ統合の効率が向上します。このバージョンには、Apache Flink 1.20.2 および 1.20.3 の主要なバグ修正も含まれています。
エンジン
このリリースでは、データ型サポート、ジョブのフォールトトレランスとリカバリ、Apache Flink の機能との同期に関して大幅なアップグレードを提供し、コアエンジン機能を強化しています。
SQL の機能強化
Bitmap 型のサポート:このリリースでは、ネイティブの Bitmap 型と、ビットマップ構築やカーディナリティ統計などの初期関数セットが追加されました。これにより、ユニークビジター (UV) 数カウントなど、効率的でリアルタイムな精密な重複排除シナリオがサポートされます。
YAML によるデータ取り込み (Flink CDC)
メタデータ参照:Flink CDC ジョブの YAML スクリプトで、カタログに登録されているソーステーブルと結果テーブルを直接参照できます。
複雑なルーティングロジック:
Routeのテーブル名を標準の正規表現で設定できます。これにより、シャーディングされたテーブルのマージシナリオがサポートされます。ダーティデータの処理:JSON 形式の解析で、ジョブの堅牢性を向上させるためのダーティデータ処理メカニズムがサポートされるようになりました。
自動精度拡張:StarRocks で
Decimal型の精度の自動拡張が部分的にサポートされるようになりました。空のスキーマのフォールトトレランス:Kafka ソースで、ソースにデータがない場合に空のスキーマでテーブルを作成できるようになりました。これにより、ジョブの起動失敗を防ぎます。
Paimon ソースのサポート:Apache Paimon が Flink CDC のソースとして正式にサポートされるようになりました。
コネクタ
スロットリング:ソースデータベースへの過剰な負荷を防ぐためのデータスロットリング機能が追加されました。
メタデータ拡張:
fileおよびposバイナリログのメタデータフィールドをサポートします。これらのメタデータフィールドを使用して、同じデータの変更順序を判断できます。パフォーマンスの最適化:
snapshot-onlyモードのプロセスが最適化され、バイナリログ関連のコマンドは実行されなくなりました。
複数の同時接続でバイナリログストリームをサブスクライブできるようになり、取り込みスループットが大幅に向上します。
テーブルレベルでのバイナリログのサブスクライブをサポートします。
OceanBase (パブリックプレビュー):新しいバイパスインポート書き込み機能をサポートし、大規模なデータバッチの書き込みパフォーマンスが大幅に向上します。
MongoDB:結果テーブルが Partial Update をサポートするようになりました。
doc_as_upsertパラメーターの明示的な設定をサポートします。接続タイムアウトパラメーターをサポートします。
Apache Kafka:Kafka コネクタによって作成された冗長なコンシューマーグループを自動的に削除できます。
データレイクハウス統合 (Iceberg)
Iceberg コネクタ:Hadoop 関連のパラメーターを設定できるようになり、複雑な Hadoop 環境での接続の柔軟性が向上します。
バグ修正
Apache Flink 1.20.2 および 1.20.3 の主要な修正が組み込まれました。
Flink が Hologres バイナリログソーステーブルからデータを消費する際に、データフィールドが誤って null として読み取られる問題が修正されました。
Kafka コネクタでトランザクションが有効化された後、Flink が Kafka からデータを読み取り OSS に書き込む際に発生していたデータ損失の問題が修正されました。
PolarDB-X 接続の切断によりレイテンシーが急激に増加し、
EOFExceptionエラーがスローされる問題が修正されました。特定のモードで不要な命令を削除することにより、CDC の実行ロジックが最適化されました。