汇总记忆存储服务的地域、记忆库、写入、检索、Scope、SDK 版本与 Agent 插件相关的配额和限制。
地域
当前仅在华北 2(北京)地域提供服务。
记忆库限制
项目 | 限制 |
记忆库名称字符 | 只能包含字母、数字和下划线 |
记忆库名称长度 | 最长 32 个字符 |
记忆库描述长度 | 最长 1024 个字符 |
创建记忆库后,索引初始化约需 1 分钟。索引初始化完成后再执行写入和检索操作。
AddMemories 限制
项目 | 限制 |
| 最多 20 条 |
| 最长 32000 个字符 |
| 最长 32000 个字符 |
| 最长 256 个字符 |
| 最多 16 个 |
| 最长 64 个字符 |
| 最长 1024 个字符 |
messages 和 text 至少提供其中一个。写入记忆时 Scope 不允许使用通配符 *。
SearchMemories 默认值
参数 | 默认值 | 说明 |
|
| 返回结果数量,取值范围 |
|
| 是否启用 Rerank |
检索长期记忆时,appId 和 tenantId 必填;agentId 和 runId 可使用通配符 *。
Scope 规则
操作 | Scope 要求 | 是否允许 |
写入记忆 |
| 否 |
检索长期记忆 |
|
|
查询短期记忆 | 四级 Scope 全部必填 | 否 |
获取单条长期记忆 | 四级 Scope 全部必填 | 否 |
更新单条长期记忆 | 四级 Scope 全部必填 | 否 |
删除单条长期记忆 | 四级 Scope 全部必填 | 否 |
列出长期记忆 | 可按层级指定 Scope | 是 |
查询请求审计 | 可按层级指定 Scope | 是 |
通配符必须按层级使用。一旦某一层级使用 *,后续层级也必须使用 * 或留空。例如 app-001/user-001/*/* 是有效范围,app-001/*/agent-001/* 不是有效范围。
异步写入可见性
AddMemories.sync 默认值为 false,即异步写入。异步写入的可见性如下:
原始消息先写入,可立即作为短期记忆查询。
长期记忆抽取在后台执行。
写入完成后约 15 秒内,长期记忆可被
SearchMemories召回。
需要在测试场景写入后立即查看抽取结果时,将 sync 设置为 true。同步写入完成后,长期记忆检索仍存在短暂的索引刷新延迟。
短期记忆查询
ListMemoryStoreMessages 用于查询原始会话消息,要求 appId、tenantId、agentId 和 runId 四级 Scope 全部填写,不支持通配符。
适用场景:
查看原始会话消息。
回放指定会话。
排查长期记忆抽取问题。
CLI 分页行为
CLI 的记忆类列表命令仅返回单页结果,不会自动翻页。需要继续读取下一页时,使用响应中的 nextToken。
示例:
tablestore-agent-cli memory list-units \
--store agent_memory \
--app-id app-001 \
--next-token <token>CLI 自动创建实例
未配置 ots_endpoint 和 ots_instance_name 时,CLI 在执行 doctor 命令或实际操作时会自动在华北 2(北京)地域创建并复用托管 Tablestore 实例。自动创建需要一定时间,创建结果会写入本地配置文件。
后续手动设置实例 Endpoint 和实例名称时,CLI 使用显式配置的实例。
SDK 版本
SDK | 版本要求 |
Python SDK |
|
Node.js SDK |
|
CLI |
|
Agent 插件说明
Hermes 和 OpenClaw 插件在检索时默认使用当前租户下的跨 Agent、跨会话范围,即 agentId=*、runId=*。如果业务不允许跨 Agent 或跨会话共享记忆,通过 SDK 自行控制检索 Scope,或调整插件配置。