すべてのプロダクト
Search
ドキュメントセンター

Realtime Compute for Apache Flink:Apache Paimon を使用してストリーミングレイクハウスを構築する

最終更新日:Nov 09, 2025

Apache Paimon(Paimon)は、さまざまなデータ型に対応した統合ストレージ形式を提供します。Paimon は Apache Flink および Apache Spark と連携して、ストリーミング操作とバッチ操作の両方をサポートするリアルタイムレイクハウスアーキテクチャを実装できます。Paimon は、レイク形式とログ構造化マージツリー(LSM)構造を革新的に組み合わせることで、レイクアーキテクチャにおけるリアルタイムストリーミング更新をサポートします。Realtime Compute for Apache Flink で Paimon テーブルを使用すると、オブジェクトストレージサービス(OSS)などのクラウドストレージサービスに基づいてデータレイクを迅速に構築できます。

Paimon は以下の機能を提供します。

  • 強化されたリアルタイムデータの取り込み:Paimon は Realtime Compute for Apache Flink と連携して、スキーマ変更の自動同期と MySQL などのさまざまなデータベースシステムからのリアルタイム更新をサポートするデータレイクにさまざまな種類のデータを取り込むことができます。数千万件のデータレコードを低レイテンシで効率的に取り込むことができます。

  • 統合されたストリーム処理とバッチ処理:Paimon は、Apache Flink と連携してストリーム処理を容易にし、Apache Spark と連携してバッチ処理を容易にします。Paimon は、データレイクストレージの統合形式を提供することで、使いやすさを向上させ、コストを削減します。

  • 広範なエコシステム統合:Paimon は、Realtime Compute for Apache Flink、E-MapReduce(Spark、StarRocks、Hive、Trino)、MaxCompute など、さまざまな Alibaba Cloud コンピューティングサービスとシームレスに統合できます。

  • 革新的なレイクハウスストレージ:Paimon は、削除ベクトルとインデックスを使用して、ストリーミング、バッチ、およびオンライン分析処理(OLAP)クエリのレイテンシを分単位で確保します。

詳細については、「Apache Paimon」をご参照ください。

使用方法

Paimon を理解する

Paimon カタログを作成する

Paimon カタログは、外部システムに格納されている Paimon テーブルへのアクセスを提供します。Paimon テーブルを一元的に管理でき、他の Alibaba Cloud サービスからアクセスできます。Paimon カタログは、以下の方法で使用できます。

Paimon テーブルを作成する

Paimon テーブルにデータを書き込む

Paimon テーブルからデータを使用する

  • Paimon テーブルからデータをクエリまたは使用します。詳細については、「Paimon テーブルからデータを使用する」をご参照ください。プライマリキーテーブルからストリーミングモードでデータを使用する場合は、changelog producer 構成を完了してください。

  • Paimon テーブルのコンシューマオフセットを設定します。詳細については、「コンシューマオフセットを設定する」をご参照ください。

  • Paimon テーブルのコンシューマオフセットを保存するか、まだ使用中の期限切れのスナップショットファイルを保持します。詳細については、「コンシューマ ID を指定する」をご参照ください。

  • バッチデプロイメントを実行して、Paimon テーブルの履歴状態を読み取ります。詳細については、「バッチタイムトラベル」をご参照ください。

Paimon テーブルを保守する