匯總記憶儲存服務的地區、記憶庫、寫入、檢索、Scope、SDK 版本與 Agent 外掛程式相關的配額和限制。
地區
當前僅在華北 2(北京)地區提供服務。
記憶庫限制
專案 | 限制 |
記憶庫名稱字元 | 只能包含字母、數字和底線 |
記憶庫名稱長度 | 最長 32 個字元 |
記憶庫描述長度 | 最長 1024 個字元 |
建立記憶庫後,索引初始化約需 1 分鐘。索引初始化完成後再執行寫入和檢索操作。
AddMemories 限制
專案 | 限制 |
| 最多 20 條 |
| 最長 32000 個字元 |
| 最長 32000 個字元 |
| 最長 256 個字元 |
| 最多 16 個 |
| 最長 64 個字元 |
| 最長 1024 個字元 |
messages 和 text 至少提供其中一個。寫入記憶時 Scope 不允許使用萬用字元 *。
SearchMemories 預設值
參數 | 預設值 | 說明 |
|
| 返回結果數量,取值範圍 |
|
| 是否啟用 Rerank |
檢索長期記憶時,appId 和 tenantId 必填;agentId 和 runId 可使用萬用字元 *。
Scope 規則
操作 | Scope 要求 | 是否允許 |
寫入記憶 |
| 否 |
檢索長期記憶 |
|
|
查詢短期記憶 | 四級 Scope 全部必填 | 否 |
擷取單條長期記憶 | 四級 Scope 全部必填 | 否 |
更新單條長期記憶 | 四級 Scope 全部必填 | 否 |
刪除單條長期記憶 | 四級 Scope 全部必填 | 否 |
列出長期記憶 | 可按層級指定 Scope | 是 |
查詢請求審計 | 可按層級指定 Scope | 是 |
萬用字元必須按層級使用。一旦某一層級使用 *,後續層級也必須使用 * 或留空。例如 app-001/user-001/*/* 是有效範圍,app-001/*/agent-001/* 不是有效範圍。
非同步寫入可見度
AddMemories.sync 預設值為 false,即非同步寫入。非同步寫入的可見度如下:
原始訊息先寫入,可立即作為短期記憶查詢。
長期記憶抽取在後台執行。
寫入完成後約 15 秒內,長期記憶可被
SearchMemories召回。
需要在測試情境寫入後立即查看抽取結果時,將 sync 設定為 true。同步寫入完成後,長期記憶檢索仍存在短暫的索引重新整理延遲。
短期記憶查詢
ListMemoryStoreMessages 用於查詢原始會話訊息,要求 appId、tenantId、agentId 和 runId 四級 Scope 全部填寫,不支援萬用字元。
適用情境:
查看原始會話訊息。
回放指定會話。
排查長期記憶抽取問題。
CLI 分頁行為
CLI 的記憶類列表命令僅返回單頁結果,不會自動翻頁。需要繼續讀取下一頁時,使用響應中的 nextToken。
樣本:
tablestore-agent-cli memory list-units \
--store agent_memory \
--app-id app-001 \
--next-token <token>CLI 自動建立執行個體
未配置 ots_endpoint 和 ots_instance_name 時,CLI 在執行 doctor 命令或實際操作時會自動在華北 2(北京)地區建立並複用託管 Tablestore 執行個體。自動建立需要一定時間,建立結果會寫入本地設定檔。
後續手動設定執行個體 Endpoint 和執行個體名稱時,CLI 使用顯式配置的執行個體。
SDK 版本
SDK | 版本要求 |
Python SDK |
|
Node.js SDK |
|
CLI |
|
Agent 外掛程式說明
Hermes 和 OpenClaw 外掛程式在檢索時預設使用當前租戶下的跨 Agent、跨會話範圍,即 agentId=*、runId=*。如果業務不允許跨 Agent 或跨會話共用記憶,通過 SDK 自行控制檢索 Scope,或調整外掛程式配置。