概要
この機能は現在、招待プレビュー中です。ご利用には、機能の招待プレビュー申請フォームにご記入ください。
EventHouse は、EventBridge のクラウドネイティブなイベントレイクハウスです。イベントデータのストレージ、ガバナンス、およびインテリジェントな分析を統合的に処理します。
EventBridge のイベントバスは、イベントのルーティングと配信を解決します。EventHouse はこれを基盤として、イベントデータが保存された後の「次に何を行うか」を実現します。EventHouse は、メッセージキュー(Kafka や RocketMQ など)、リレーショナルデータベース(MySQL など)、オブジェクトストレージ(OSS など)から取得した構造化データ、半構造化データ、非構造化データを、標準化されたイベントモデルに統一します。組み込みの Open Catalog および AI セマンティックレイヤーを活用することで、ゼロETL(Zero-ETL)による異種データソースの統合管理を実現し、SQL クエリや AI エージェントを通じたリアルタイム分析を可能にします。

コアコンポーネント
EventHouse は、以下の 3 つのコアコンポーネントで構成されます。各コンポーネントは独立して動作しますが、密接に連携します。
コンポーネント | 位置 | 主な機能 |
メタデータ管理センター | マルチソースメタデータ登録、スキーマ進化管理、データリネージトラッキング、細かい粒度でのアクセス制御 | |
コンピュートエンジンレイヤー | 統合ストリームおよびバッチ SQL、フェデレーテッドクエリ、マテリアライズドビュー、リアルタイム異常検出 | |
AI 分析レイヤー | AI セマンティックレイヤー、MCP プロトコル統合、自律型 DataAgent 分析、自然言語によるクエリ実行 |
主な価値
ゼロETL(シームレスなデータ統合)
RDS や OSS などの外部データソースを直接マップし、EventHouse へのデータ移行を経ずにフェデレーテッドクエリを実行できます。これにより、データ遅延とストレージコストを削減します。
統合ガバナンス
Open Catalog を使用して、スキーマ定義のないメッセージキューから発生する「ダークデータ」のメタデータ管理およびデータリネージトラッキングを実施し、データサイロを解消します。
エージェント型分析(Agentic analytics)
MCP(Model Context Protocol)をネイティブ統合。AI エージェントがイベントデータの構造を理解し、自然言語による質問に基づいて分析を実行します。
データカタログ
データカタログは、EventHouse のメタデータ管理センターです。接続されたすべてのデータソースについて、メタデータ、スキーマ定義、アクセス権限、およびデータリネージを管理します。
統合メタデータ管理
マルチソースマッピング:カタログは、Kafka、RocketMQ、RDS などのデータソースから自動的にメタデータを発見・登録します。
スキーマ進化:イベントデータのスキーマバージョンを自動的に推論・管理します。上流のフィールド変更に対しても互換性を維持し、下流の分析タスクが中断しないようにします。
データリネージトラッキング:イベントのライフサイクル全体(生成(プロデューサー)→ ストレージ(イベントストア)→ 分析)を追跡し、トラブルシューティングおよび影響評価を支援します。
オープンエコシステムとの互換性
Open Catalog は、Iceberg、Hudi、Delta Lake などのオープンテーブルフォーマットをサポートします。ベンダーロックインを回避し、任意のコンピュートエンジンを選択できます。
権限とセキュリティ
データベース、テーブル、カラムレベルで細かい粒度のアクセス制御(ACL)を提供します。
ユースケース:統合データビュー
E コマースでは、注文データが RocketMQ(リアルタイムストリーム)と MySQL(永続化)に分割されることがあります。カタログを活用して、MQ 内のリアルタイム注文ストリームとデータベース内のユーザー情報テーブルを論理的に結合した統合ビューを作成できます。このビューを直接クエリすれば、データの物理的な格納場所を意識する必要はありません。
データ分析
データ分析は、EventHouse のコンピュートエンジンレイヤーです。高性能な SQL クエリ、ストリーム処理、およびフェデレーテッドクエリ機能を提供します。
インテリジェントクエリエンジン
マルチモーダルクエリ:SQL(構造化)、NoSQL(ドキュメントベース)、外部(外部データソース)の 3 種類のクエリモードをサポートします。
統合ストリームおよびバッチ:同一の SQL 構文を用いて、履歴アーカイブデータ(バッチ)とリアルタイムイベントストリーム(ストリーミング)の両方をクエリできます。
マテリアライズドビュー:頻繁に実行されるクエリ結果をマテリアライズドビューに事前計算・キャッシュすることで、ミリ秒単位の応答時間を実現します。
フェデレーテッドクエリ
クロスソース連携分析:データ移行を行わず、SQL
JOINを使用して、EventHouse 内の内部テーブルと OSS のログファイルや RDS のディメンションテーブルなどの外部ソースを直接結合できます。プリディケートプッシュダウン:フィルター条件をソース側にプッシュダウンし、必要なデータのみを取得することで、クエリ効率を向上させます。
リアルタイム異常検出
Tumble、Hop、Session などの組み込みタイムウィンドウ関数を活用し、トランザクション成功率やレイテンシ分布などのリアルタイムメトリックを算出します。
ルールエンジンと組み合わせることで、分析結果がしきい値を超えた場合(例:「1 分間に 100 件以上の失敗注文」)に、アラートイベントを自動的にトリガーします。
技術的優位性
機能 | 説明 |
ストレージとコンピュートの分離 | 低コストのオブジェクトストレージにデータを保存し、トラフィックの急増に対応できるよう、計算リソースを柔軟にスケールできます。 |
高圧縮率 | イベントデータ(JSON/CloudEvents)向けに最適化されたカラム指向圧縮を適用。従来のデータベースと比較して、ストレージコストを 50% 以上削減します。 |
データインテリジェンス(Luma)
Luma は、EventHouse の AI 分析レイヤーです。AI セマンティックレイヤーおよび MCP プロトコルを活用し、大規模言語モデル(LLM)がイベントデータを直接理解・分析できるようにします。
DataAgent
Luma には、自律的に「センス–プラン–アクション」ループを実行する組み込み DataAgent が含まれています。
Sense: トランザクション数の異常な減少を検出します。
プラン:支払いゲートウェイのログおよびデータベース接続プールの状態をクエリすることを決定します。
アクション:相関分析用の SQL を自動生成し、根本原因レポートを出力します。
AI セマンティックレイヤー
従来のデータベースフィールド(例:col_1、status_code)は、AI モデルにとってビジネス上の意味を持たないため、分析精度が低下します。Luma では、カタログ内のフィールドにビジネス説明、同義語、計算ロジックを追加できます。このセマンティック情報を活用することで、Text-to-SQL の精度を向上させます。
例:自然言語で「昨日の北京における支払い失敗注文を表示してください」と質問すると、Luma が対応する SQL を自動生成し、結果を返します。
ユースケース:E コマースにおけるリスク管理
オペレーターが「過去 30 分間に異常なサクラ注文行為はありましたか?」と質問します。
Luma エージェントが MCP を使用してカタログ情報を取得し、
Transaction_TableおよびUser_Behavior_Logを特定します。エージェントが、タイムウィンドウ、IP 集約、デバイスフィンガープリント分析を含む相関 SQL クエリを自動生成し、EventHouse の分析エンジンで実行します。
疑わしいサクラ注文ユーザーの UserID 一覧を返し、ナレッジベースを活用してリスクレポートを生成します。
MCP プロトコル統合
EventHouse は MCP(Model Context Protocol)をネイティブサポートしています。LangChain、Dify、またはカスタムエージェントなど、MCP 互換の AI エージェントであれば、EventHouse に接続できます。
ツールベースのクエリ:クエリ機能を MCP ツールとしてラップし、エージェントがユーザーの意図に応じて呼び出します。
コンテキスト認識:エージェントはデータスキーマをコンテキストとして活用し、より正確な分析結果を生成します。
MCP プロトコル統合は、現時点ではご利用できません。リリース日については、今後の製品アップデートをご確認ください。