概述
此功能目前處於邀約測試階段。如果您想使用此功能,請在功能邀測申請表中填寫相關資訊進行開通。
EventHouse 是 EventBridge 的雲原生事件湖倉(Cloud-Native Event Lakehouse),負責事件數目據的儲存、治理與資料智能。
EventBridge 的事件匯流排(EventBus)解決事件的路由與分發問題,EventHouse 在此基礎上解決事件數目據“存下來之後怎麼用”的問題。EventHouse 將訊息佇列(如 Kafka、RocketMQ)、關係型資料庫(如 MySQL)以及Object Storage Service(如 OSS)中的結構化、半結構化和非結構化資料統一抽象為標準事件模型,通過內建的 Open Catalog 和 AI 語義層,支援以 Zero-ETL 方式管理多源異構資料,並通過 SQL 查詢或 AI Agent 直接進行即時分析。

核心組件
EventHouse 由三個核心組件構成,各組件獨立又協同工作:
組件 | 定位 | 核心能力 |
中繼資料管理中心 | 多源中繼資料註冊、結構變更管理、資料血緣追蹤、細粒度許可權控制 | |
計算引擎層 | 流批一體 SQL、聯邦查詢、物化視圖(Materialized View)、即時異常檢測 | |
AI 分析層 | AI 語義層、MCP 協議整合、DataAgent 自主分析、自然語言查詢 |
核心價值
Zero-ETL(無感Data Integration)
支援直接映射外部資料源(如 RDS、OSS),無需將資料搬運到 EventHouse 即可執行聯集查詢,降低資料延遲和儲存成本。
統一治理(Unified Governance)
通過 Open Catalog 為訊息佇列中缺乏 Schema 定義的資料(即"暗資料")提供標準化的中繼資料管理和血緣追蹤,打破資料孤島。
智能體分析(Agentic Analytics)
原生整合 MCP(Model Context Protocol),AI Agent 可直接理解事件數目據結構,通過自然語言提問完成資料分析。
資料目錄 Catalog
資料目錄(Catalog)是 EventHouse 的中繼資料管理中心,負責管理所有接入資料來源的中繼資料、Schema 定義、存取權限及資料血緣。
統一中繼資料管理
多源映射:Catalog 自動探索並註冊來自 Kafka、RocketMQ、RDS 等資料來源的中繼資料。
結構變更(Schema Evolution):自動推斷並管理事件數目據的 Schema 版本。當上遊業務欄位變更時,通過相容性版本管理確保下遊分析任務不中斷。
資料血緣追蹤:追蹤事件從產生(Producer)、儲存(EventStore)到分析(Analysis)的全鏈路,用於故障排查和影響面評估。
開放生態相容
Open Catalog 支援 Iceberg、Hudi、Delta Lake 等開放表格式,資料不被廠商鎖定,可自由選擇計算引擎。
許可權與安全
提供庫(Database)、表(Table)、列(Column)三級細粒度存取控制(ACL)。
應用情境:統一資料檢視
在電商情境中,訂單資料可能分散在 RocketMQ(即時資料流)和 MySQL(持久化)中。通過 Catalog 建立統一 View,邏輯關聯 MQ 中的即時訂單流和資料庫中的使用者資訊表。分析時只需查詢該 View,無需關心底層資料的實體儲存體位置。
資料分析 Analysis
資料分析(Analysis)是 EventHouse 的計算引擎層,提供高效能的 SQL 查詢、串流和聯邦查詢能力。
智能查詢引擎
多模態查詢:支援 SQL(結構化查詢)、NoSQL(文檔型查詢)和 External(外部資料源查詢)三種查詢模式。
流批一體:同一套 SQL 文法既可查詢歷史歸檔資料(Batch),也可查詢即時資料流入的事件流(Streaming)。
物化視圖(Materialized View):支援預計算物化視圖,將高頻查詢結果緩衝,實現毫秒級響應。
聯邦查詢
跨源聯合分析:無需資料移轉,通過 SQL
JOIN直接關聯 EventHouse 內部表與外部資料源(如 OSS 記錄檔、RDS 維表)。謂詞下推(Predicate Pushdown):將過濾條件下推到源端執行,僅拉取必要資料,提升查詢效率。
即時異常檢測
內建時間視窗函數(Tumble、Hop、Session),支援Realtime Compute交易成功率、延遲分布等指標。
結合規則引擎,當分析結果觸發閾值(例如“1 分鐘內失敗訂單超過 100”)時,自動觸發警示事件。
技術優勢
特性 | 說明 |
存算分離 | 儲存基於低成本Object Storage Service,計算資源Auto Scaling,應對流量洪峰 |
高壓縮比 | 針對事件數目據(JSON/CloudEvents)進行列式壓縮,儲存成本較傳統資料庫降低 50% 以上 |
資料智能 Luma
Luma 是 EventHouse 的 AI 分析層,通過 AI 語義層和 MCP 協議,使大語言模型(LLM)能夠直接理解和分析事件數目據。
DataAgent
Luma 內建 DataAgent,可自主執行"感知 - 規劃 - 行動"迴圈:
感知:監控到交易量異常下跌。
規劃:決定查詢關聯的支付網關日誌和資料庫連接池狀態。
行動:自動產生 SQL 進行關聯分析,輸出根因報告。
AI 語義層
傳統資料庫欄位(如 col_1 、status_code )對 AI 模型缺乏業務含義。Luma 支援在 Catalog 中為欄位添加業務描述、同義字和計算邏輯,基於這些語義資訊提升 Text-to-SQL 的準確率。
樣本 :通過自然語言提問"查詢昨天北京地區支付失敗的訂單",Luma 自動產生對應 SQL 並返回結果。
應用情境:電商風控
營運人員提問:"最近半小時有沒有異常的刷單行為?"
Luma Agent 通過 MCP 擷取 Catalog 資訊,識別
Transaction_Table和User_Behavior_Log。Agent 自動產生關聯 SQL(包含時間視窗、IP 彙總、裝置指紋分析),在 EventHouse 分析引擎中執行。
返回疑似刷單的 UserID 列表,結合知識庫產生風險報告。
MCP 協議整合
EventHouse 原生支援 MCP(Model Context Protocol)。任何支援 MCP 的 AI Agent(如 LangChain、Dify 或自訂 Agent)均可串連 EventHouse:
工具化查詢:查詢能力封裝為 MCP Tools,Agent 根據使用者意圖自主調用。
上下文感知:Agent 擷取資料 Schema 作為上下文,產生更準確的分析結果。
MCP 協議整合功能待開放,具體開放時間請關注產品動態。