記憶儲存服務(Memory Storage)基於Table Store Tablestore 構建,為 AI Agent 提供 Serverless 的記憶寫入、自動提取與語義檢索能力,支援百萬租戶級資料隔離與跨會話記憶複用。
什麼是記憶儲存服務
記憶儲存服務(Memory Storage)是基於Table Store Tablestore 構建、面向 AI Agent 情境提供的記憶儲存與管理能力。開發人員將對話訊息或文本寫入記憶庫,服務儲存原始訊息,並從中提取可檢索的長期記憶單元。後續對話中,Agent 通過自然語言查詢召回相關記憶,用於產生更連續、更貼合使用者內容相關的回複。
AI Agent 在真實業務中通常需要處理連續對話、跨會話偏好、使用者畫像和歷史事實。僅依賴當前上下文視窗會帶來 Token 成本上升、歷史資訊遺漏和上下文幹擾等問題;完全由應用自行管理記憶抽取、儲存和檢索,則需要額外建設 LLM 調用、向量檢索、全文檢索索引、資料隔離和審計等能力。記憶儲存服務將這些能力封裝為統一的記憶庫介面,開發人員可通過 SDK、CLI 或 Agent 外掛程式接入,無需從零實現記憶抽取與檢索鏈路。
核心價值
Serverless,即開即用
服務採用全託管的 Serverless 架構,開發人員通過 API 完成記憶的寫入和檢索,無需關心底層資源的部署和營運。隨用隨付,零用量零費用。
記憶自動提取,無需額外開發
將對話訊息或文本傳入後,系統自動從中提取關鍵事實和偏好,產生結構化的記憶單元。開發人員無需編寫額外的提取邏輯,也無需自行處理記憶的抽取和組織。
海量規模,彈性無上限
基於Table Store的分布式架構,系統支援水平擴充,理論上沒有儲存規模上限。滿足百萬租戶、百億條記憶儲存的情境需求。
精準語義檢索
支援向量檢索與全文檢索索引的混合檢索模式,以自然語言作為查詢輸入即可召回相關記憶,同時可選啟用 Rerank 二次排序進一步提升結果相關性。相較於業界主流mem0記憶的檢索準確率大幅提升。
Token 成本大幅降低
相比傳入完整對話歷史,記憶儲存方案實現約 84% 的 Token 節省,且回答語義品質幾乎無損。減少無關上下文注入協助 LLM 聚焦關鍵資訊,避免全量歷史注入帶來的 Token 消耗 O(N²) 增長和"Lost in the Middle"效能退化。
海量租戶隔離
通過 appId、tenantId、agentId、runId 四級 Scope 實現資料隔離,開發人員可按應用、租戶、Agent 和交談群組織記憶資料邊界,滿足百萬租戶層級的多租戶隔離需求。
多種接入方式
支援 Python SDK、Node.js SDK、命令列工具,以及 Hermes、OpenClaw 等 Agent 生態外掛程式。開發人員可根據業務情境選擇合適的接入方式。
與開源方案對比
記憶儲存服務與業界主流開源記憶方案 mem0 的核心差異如下。
對比維度 | 記憶儲存服務(Memory Storage) | 開源 mem0 |
部署營運 | Serverless,API 即開即用,零營運 | 需自行部署和營運底層組件 |
記憶提取 | 系統自動提取,無需額外開發 | 需自行管理記憶抽取邏輯 |
檢索準確率 | LoCoMo 綜合 76.34%,複雜推理情境表現突出 | LoCoMo 綜合 64.20% |
檢索延時 | 億級資料 P95 ≤ 288 ms | 億級資料 P95 約為Table Store的 4 倍 |
儲存規模 | 水平擴充,已驗證 120 萬租戶、1 億+ 條記憶 | 受限於底層儲存方案 |
多租戶隔離 | 四級 Scope 原生支援,開箱即用 | 需自行設計隔離方案 |
詳細評測資料和方法請參見架構與技術選型。
適用情境
多輪對話連續性
長對話情境中,將歷史訊息寫入記憶庫,由服務保留原始訊息並提取關鍵事實。後續對話僅按需召回相關記憶,避免將完整歷史全量注入上下文。
跨會話偏好沿用
使用者在多個會話中表達的偏好、習慣和約束被提取為長期記憶單元,新會話中通過語義檢索召回,使 Agent 在不同時間、不同入口仍能保持一致的應答風格。
多 Agent 知識共用
通過四級 Scope 中 agentId 通配,多個 Agent 可在同一租戶範圍內共用同一份使用者記憶,避免在每個 Agent 中重複抽取和維護相同的事實。
使用者畫像沉澱
將使用者行為、屬性和歷史事實持續寫入記憶庫,由服務自動歸併為結構化的畫像單元,供推薦、客服、營銷等下遊 Agent 直接召回使用。
接入方式
接入方式 | 適用情境 | 文檔 |
SDK | 在商務服務或 Agent 應用中直接調用記憶服務 | |
CLI | 本地調試、營運管理、自動化指令碼 | |
Agent 外掛程式 | 在現有 Agent 架構中自動接入記憶檢索和寫回 |
支援地區
當前僅在華北 2(北京)地區提供服務。