このトピックでは、Realtime Compute for Apache Flink のリリースノートについて説明し、関連リファレンスへのリンクを提供します。リリースノートでは、2022 年 3 月 4 日にリリースされたバージョンの Realtime Compute for Apache Flink の主要な更新とバグ修正を提供します。
概要
Ververica Runtime (VVR) 4.0.12 は、2022 年 3 月 4 日に正式にリリースされました。このバージョンは Apache Flink 1.13 をベースに開発されています。このバージョンでは、Realtime Compute for Apache Flink は Message Queue for Apache Kafka から Hologres への JSON スキーマ変更を同期できます。 Realtime Compute for Apache Flink は、Data Lake Formation (DLF) で動作するエンタープライズレベルの Hudi コネクタを提供します。開発効率を向上させるために、Realtime Compute for Apache Flink は 20 を超える一般的な Flink SQL ジョブテンプレートを提供します。 O&M 機能を強化するために、Realtime Compute for Apache Flink は、ジョブを停止することなく、強力なジョブ診断と動的なログレベル調整をサポートしています。 Realtime Compute for Apache Flink は、ClickHouse のエンタープライズレベルの機能、新しいコネクタ、データウェアハウスおよびデータレイクへのデータ取り込みのための新しい構文など、さまざまなデータ処理機能もサポートしています。 Apache Flink コミュニティで修正されたいくつかの問題は、このバージョンでも修正されています。
新機能
機能 | 説明 | リファレンス |
Hologres への JSON スキーマ変更の同期 | JSON は、ストリーム処理で最も一般的なイベント形式の 1 つです。スキーマの変更は、バックエンドストレージエンジンのリアルタイムストリーミングジョブとテーブルに対して透過的であることが期待されます。 このバージョンでは、この要件を満たすために、次の機能強化が提供されています。
| |
Iceberg および Hudi のデータレイク構築機能の強化 |
| |
ログの表示と設定の使いやすさの向上 |
| |
Realtime Compute for Apache Flink でサポートされている複数のエンタープライズレベルの ClickHouse 機能 |
| |
最適化されたジョブ診断ルールと [診断] パネル |
| |
データ同期中の計算列の追加 | CREATE TABLE AS ステートメントを使用してデータを同期する場合、計算列をソーステーブルに追加し、デスティネーションテーブルのプライマリキー列として使用できます。 データウェアハウスまたはデータレイクにデータを取り込む場合、CREATE TABLE AS ステートメントを実行して、追加する計算列の位置を指定し、その列をデスティネーションテーブルの物理列として使用できます。これにより、計算列の結果をデスティネーションテーブルにリアルタイムで同期できます。また、CREATE TABLE AS ステートメントを実行して、デスティネーションテーブルのプライマリキーを変更し、新しい列をデスティネーションテーブルの新しいプライマリキー列として使用することもできます。 | |
テストデータの生成 | Faker コネクタがサポートされています。 Faker コネクタを使用すると、ビジネス要件を満たすテストデータをより簡単に生成できます。これにより、開発およびテスト中にビジネスロジックを検証できます。 | |
ジョブ開発を加速するためのテンプレートセンターの提供 |
| |
リソース使用率の表示 | 現在のプロジェクトの CPU 使用率とメモリ使用量は、Realtime Compute for Apache Flink の開発コンソールの左下に表示されます。情報に基づいてプロジェクトリソースを管理できます。 | 該当なし |
チェックポイントが低速で作成されるジョブのログの迅速な特定 | スナップショット履歴内のノードのスナップショット状態をソートできます。さらに、[Flink チェックポイント履歴] タブから [実行中のタスクマネージャー] タブの [ログ] タブに移動して、ジョブのチェックポイントが作成される速度が遅い原因を表示できます。 | |
AnalyticDB for PostgreSQL 結果テーブルと AnalyticDB for PostgreSQL ディメンションテーブルの作成 |
| |
エンタープライズレベルのステートバックエンドストレージの使いやすさの向上 |
|
パフォーマンスの向上
このバージョンでは、エンタープライズレベルのステートバックエンドストレージが大幅に改善されています。デュアルストリームまたはマルチストリーム JOIN ジョブのパフォーマンスが大幅に向上しました。平均計算リソース使用率を 50% 向上させることができます。典型的なシナリオでは、平均計算リソース使用率を 100% から 200% 向上させることができます。これにより、ステートフルストリーム処理アプリケーションをよりスムーズに実行できます。
修正された問題
データベースまたはテーブルに大量のデータが含まれている場合、データの更新後にデータが表示されない問題を修正するために、カタログサービスが最適化されています。
セッションクラスターの Flink バージョンが表示されない問題が修正されました。
[メトリクス] タブに watermarkLag 曲線が期待どおりに表示されない問題が修正されました。
[メトリクス] タブで曲線チャートをページごとに表示する効果が最適化されています。
currentFetchEventTimeLag メトリックの問題やクラスの競合などの Flink CDC の問題が修正されました。
CREATE TABLE AS ステートメントを使用して既存の列を変更できない問題が修正されました。