記憶儲存用於為智能體提供對話歷史、工作階段狀態和長期記憶的持久化能力。本文介紹如何通過控制台建立、配置和管理記憶儲存執行個體,以及如何為智能體綁定記憶儲存。
什麼是記憶儲存
記憶儲存(MemoryCollection)是 AgentRun 為智能體提供的資料持久化服務,支援以下三種記憶類型:
-
長期記憶:儲存使用者在多輪對話中積累的偏好和知識,通過大語言模型(LLM)和向量模型實現語義檢索。
-
會話歷史:記錄完整的對話歷史,保持多輪對話的上下文連貫性。
-
工作階段狀態:維護對話過程中的即時狀態資訊,如當前任務進度、中間變數等。
建立記憶儲存時,可以選擇向量資料庫的底層儲存引擎為Table Store或雲資料庫 RDS 版。兩種引擎均支援長期記憶功能,但會話歷史和工作階段狀態功能僅 OTS 引擎支援。
前提條件
-
已開通 AgentRun 服務並建立工作空間。
-
如選擇自訂 OTS 配置,需已開通Table Store 服務。
-
如選擇自訂 RDS 配置,需已建立 RDS MySQL 執行個體並開啟
向量儲存功能(MySQL 8.0.30 及以上版本支援)。 -
如開啟長期記憶功能,需已配置大語言模型和向量模型服務。
通過控制台建立記憶儲存
操作步驟
-
登入AgentRun 控制台,在左側導覽列選擇記憶。
-
單擊建立記憶儲存。
-
配置基礎資訊:
-
記憶儲存名稱:系統自動產生
mem-xxxx格式的名稱,也可手動修改。名稱需符合命名規範。 -
描述:可選,填寫記憶儲存的用途說明。
-
-
配置向量資料庫。支援兩種配置方式:
-
自動設定(推薦):系統自動建立 OTS 執行個體並完成配置,一鍵部署。
-
自訂配置:手動選擇向量資料庫類型(OTS 或 RDS)並填寫詳細參數。詳見下方向量資料庫配置參數。
-
-
配置功能開關。根據需要開啟会话历史和会话状态功能。
重要會話歷史和工作階段狀態功能僅OTS 類型的記憶儲存支援。選擇 RDS 類型的向量資料庫時,不展示這兩個開關。
-
配置網路。支援公網和專用網路兩種網路類型。選擇 RDS 類型時,網路類型強製為專用網路。詳見下方網路設定。
-
確認配置資訊無誤後,單擊开始部署。
向量資料庫配置參數
OTS 配置
選擇自訂配置→OTS時,需配置以下參數:
|
參數 |
說明 |
樣本值 |
|
OTS 執行個體 |
選擇已建立的Table Store執行個體。每個執行個體只能被一個記憶儲存綁定。 |
my-ots-instance |
|
表名 |
系統預設為 |
mem0 |
|
向量維度 |
根據所選向量模型自動化佈建,取值範圍 64~2048。 |
1536 |
RDS 配置
選擇自訂配置→RDS時,需配置以下參數:
|
參數 |
說明 |
樣本值 |
|
RDS 執行個體 |
選擇已開啟向量儲存功能的 RDS MySQL 執行個體。未開啟向量儲存的執行個體不可選。 |
rm-bp1xxxxx |
|
資料庫名稱 |
選擇 RDS 執行個體下的目標資料庫。 |
my_database |
|
表名 |
自訂表格名,用於儲存記憶資料。必須以字母或底線開頭,可包含字母、數字和底線。 |
mem0 |
|
使用者名稱 |
RDS 資料庫的訪問使用者名稱。 |
admin |
|
訪問憑證 |
RDS 模式下強制啟用。可選擇已有憑證或建立新憑證,用於Secure Store 資料庫密碼。 |
my-credential |
|
連接埠 |
RDS 資料庫的串連連接埠,預設 3306。 |
3306 |
|
向量維度 |
根據所選向量模型自動化佈建,也可手動輸入。取值範圍 64~2048。 |
1536 |
RDS 執行個體必須已開啟向量儲存功能。如尚未開啟,可前往 RDS 控制台開通向量儲存。
模型配置
開啟長期記憶功能後,需配置大語言模型(LLM)和向量模型(Embedding),用於記憶的語義理解和向量化。
大語言模型配置
|
參數 |
說明 |
樣本 |
|
模型服務 |
選擇已配置的模型服務提供者,如百鍊、OpenAI 等。 |
百鍊 |
|
具體模型 |
選擇具體的模型名稱,如 qwen-plus、qwen-max 等。 |
qwen-plus |
向量模型配置
|
參數 |
說明 |
樣本 |
|
模型服務 |
選擇已配置的向量模型服務提供者。 |
百鍊 |
|
具體模型 |
選擇具體的向量模型名稱。不同模型支援的向量維度不同,會影響向量資料庫的維度配置。 |
text-embedding-v4 |
向量模型維度相容性
不同向量模型支援的向量維度如下表所示。選擇模型後,系統會自動化佈建預設維度,也可在 RDS 自訂配置時手動調整(需在模型支援的維度範圍內)。
|
向量模型 |
支援的維度 |
預設維度 |
|
|
2048、1536、1024、768、512、256、128、64 |
1536 |
|
|
1024、768、512、256、128、64 |
768 |
|
|
1536 |
1536 |
|
|
1536 |
1536 |
執行角色
開啟長期記憶功能時,必須配置執行角色(ExecutionRoleArn),用於授權 AgentRun 服務訪問模型服務和向量資料庫。選擇已有角色或建立新角色。
網路設定
網路設定用於控制記憶儲存執行個體的網路訪問方式。支援以下兩種網路類型:
|
網路類型 |
說明 |
配置項 |
|
公網 |
通過公網訪問,無需額外網路設定。自動設定模式下預設使用此方式。 |
無需配置 |
|
專用網路 |
通過 VPC 內網訪問,延遲更低、安全性更高。選擇 RDS 類型時強制使用此方式。 |
VPC ID、交換器(VSwitch)、安全性群組 |
選擇 RDS 類型的向量資料庫時,網路類型強製為專用網路,且 VPC 需與 RDS 執行個體所在的 VPC 一致。
開啟會話歷史和工作階段狀態
在建立記憶儲存時,可以開啟以下兩項功能:
-
会话历史:記錄完整的對話歷史,包括使用者輸入和智能體回複。開啟後,智能體可以在多輪對話中保持上下文連貫。
-
会话状态:維護對話過程中的即時狀態資訊,如任務進度、中間變數等。開啟後,智能體可以追蹤和管理對話過程中的狀態變化。
會話歷史和工作階段狀態功能建立後不可關閉。請在建立前根據實際需求決定是否開啟。
会话历史和会话状态功能僅OTS 類型的記憶儲存支援。選擇 RDS 類型時,不展示這兩個功能開關。
編輯記憶儲存
可以修改記憶儲存的部分配置資訊,包括描述、網路設定等。
-
在記憶儲存列表中,找到目標記憶儲存。
-
單擊記憶儲存名稱,進入詳情頁。
-
在概览頁簽中,找到需要修改的配置項,單擊對應地區的編輯表徵圖進行修改。
-
修改完成後,儲存配置。
部分核心配置(如向量資料庫類型、向量資料庫執行個體)建立後不可修改。
重設記憶儲存
重設功能用於清除記憶儲存中的所有資料(如會話歷史、工作階段狀態和長期記憶資料),但保留配置資訊。重設後,記憶儲存將恢複到初始狀態,可以重新開始使用。
-
在記憶儲存詳情頁中,找到重設操作入口。
-
在彈出的確認對話方塊中,確認重設操作的影響範圍。
-
確認後,系統將清除所有記憶資料。
刪除記憶儲存
刪除記憶儲存是無法復原操作,所有關聯資料(包括長期記憶、會話歷史、工作階段狀態等)將被永久刪除,且無法恢複。請謹慎操作。
-
在記憶儲存列表中,找到目標記憶儲存。
-
在操作列中,單擊刪除。
-
在彈出的確認對話方塊中,輸入記憶儲存名稱進行二次確認。
-
單擊确认删除记忆存储,等待刪除完成。
為智能體綁定記憶儲存
建立記憶儲存後,可以在智能體建立或配置頁面為其綁定記憶儲存,使智能體具備持久化記憶的能力。
-
在建立或編輯智能體時,找到上下文資源配置地區。
-
在記憶儲存綁定地區,從右側可選列表中選擇已建立的記憶儲存,單擊添加按鈕將其添加到已繫結資料行表。
-
可通過搜尋方塊按記憶儲存名稱快速篩選。
-
如需解除綁定,在已繫結資料行表中單擊對應記憶儲存右側的移除按鈕。
記憶類型標籤
在繫結資料行表中,每個記憶儲存會顯示一個類型標籤,標識其主要功能類型。標籤由系統根據記憶儲存的配置自動推斷:
|
記憶類型 |
推斷條件 |
說明 |
|
|
開啟了會話歷史功能 |
保持對話內容相關的一致性,適用於多輪對話情境。 |
|
|
配置了向量資料庫儲存 |
結構化知識儲存,通過向量檢索實現語義化記憶召回。 |
|
|
未開啟會話歷史且未配置向量資料庫(預設類型) |
長期記憶持久化管理,儲存使用者跨會話的偏好和知識。 |