通過知識儲存(RAG)服務,將文檔上傳後即可通過混合檢索為大語言模型(LLM)提供精準的上下文資訊。以下介紹知識儲存服務的定位、核心價值、典型應用情境和與開源方案的對比。
什麼是知識儲存(RAG)服務
知識儲存(RAG)服務是基於阿里雲Table Store(Tablestore)構建的全託管 RAG(Retrieval-Augmented Generation,檢索增強產生)服務。它為企業和開發人員提供了從文檔匯入、智能解析、自動切片、向量化到混合檢索的一站式能力,協助使用者快速構建高品質的知識檢索系統,為大語言模型(LLM)提供精準的上下文資訊。
知識儲存服務採用 Serverless 架構,使用者通過 API 即開即用,無需部署和維護任何物理伺服器或基礎設施。文檔上傳後,系統自動完成解析、切塊、構建索引等全部處理流程,使用者只需關注商務邏輯本身。
在典型的 AI 應用鏈路中,知識儲存服務處於核心的“知識管理與檢索”環節。
當前支援地區:華北2(北京)、華東2(上海)、華東1(杭州)、華南1(深圳)、中國香港、新加坡。可就近選擇地區接入。
核心價值
Serverless,即開即用
知識儲存服務是完全的 Serverless 服務。使用者通過 API 呼叫即可建立知識庫、上傳文檔、執行檢索,無需購買和部署物理伺服器,無需關心底層資源的擴縮容。這意味著從零到生產環境可用,只需要幾行 API 呼叫,極大地降低了技術門檻和營運成本。
隨用隨付,零元起步
無最小規格、無最低消費。儲存與計算獨立隨用隨付,用多少付多少。業務低穀期近乎零成本,高峰期自動彈性擴充,徹底告別資源閑置浪費。
海量規模,彈性無上限
單個知識庫預設最大支援 1 億級文檔。無論是初創團隊的小規模試用,還是大型企業的海量知識管理,知識儲存服務都能從容應對。底層基於Table Store的分布式架構,天然具備水平擴充能力,業務增長無需擔憂容量瓶頸。
全託管知識庫流水線
文檔上傳後,系統自動完成文檔解析、智能切塊、Embedding 向量化、索引構建等全部處理流程。當前已支援 PDF、Word(doc/docx)、Excel(xls/xlsx)、PowerPoint(ppt/pptx)、純文字(txt)、Markdown(md)等主流文檔格式。使用者無需自行搭建文檔處理 Pipeline,無需管理 Embedding 模型的部署和營運,也無需手動構建和維護向量索引。整個知識庫的生命週期管理都由服務端自動完成。
資料自持,完全可控
整個流程中的未經處理資料、中間資料和結果資料都儲存在使用者自己的雲端服務帳號(OSS Bucket或Tablestore執行個體)內。服務本身不持有或轉存任何使用者資料。這種架構確保了資料的所有權和安全性完全掌握在客戶手中,滿足金融、政務、醫學等對資料合規性要求極高的行業需求。
靈活重排,精準召回
內建 RRF、加權融合、模型 Rerank 三種重排策略,可按業務情境靈活選用,對召回結果進行多維度精排,確保最相關的內容優先呈現。同時支援向量檢索與全文檢索索引雙通道混合召回——向量檢索捕捉語義相似性,全文檢索索引保障關鍵詞精確匹配,二者互補,最大化召回覆蓋面。
自主可控,開放定製
核心模組均支援客戶通過介面和參數進行控制與調整。從 Embedding 模型選擇(內建百鍊模型或自訂模型)、檢索策略配置(檢索類型、召回數量、Rerank 方式)、中繼資料過濾條件,到 Chunk 層級的內容修改和狀態管理,使用者可以根據業務需求精細調控知識庫的每一個環節。
典型應用情境
企業知識問答系統
將企業內部的產品文檔、技術手冊、FAQ、規章制度等匯入知識庫,結合 LLM 構建智能問答系統。員工或客戶提出問題時,系統從知識庫中檢索最相關的內容片段,交由 LLM 產生準確、有據可查的回答。適用於客服、HR、法務、IT 營運等多個部門。
文檔智能搜尋與摘要
替代傳統的關鍵詞搜尋引擎,利用向量檢索理解使用者的搜尋意圖,返回語義最相關的文檔片段。配合中繼資料過濾(按時間、分類、作者等維度篩選),實現精準的文檔檢索體驗。
多租戶 SaaS 知識庫
利用 Subspace 機制,在同一個知識庫內為不同租戶(使用者、部門、客戶)隔離資料。每個租戶只能檢索到自己 Subspace 下的文檔,天然實現資料隔離,無需為每個租戶建立獨立的知識庫,大幅降低管理複雜度和成本。
RAG Pipeline 整合
作為 RAG 架構中的檢索層,與 LangChain、LlamaIndex 等主流 AI 框架組成。使用者將文檔灌入知識庫,在推理階段調用 Retrieve 介面擷取相關上下文,拼接到 Prompt 中送入 LLM,實現知識增強產生效果。
合規文件管理與審計
金融、醫學、政務等行業的合規文件管理情境。所有資料存放區在客戶自己的雲賬戶內,滿足資料不出域的合規要求。通過中繼資料(metadata)標註文檔的分類、版本、有效期間等屬性,結合 Metadata Filter 實現精準的合規文檔檢索。
與開源方案對比
對比維度 | 知識儲存(RAG)服務 | 自建方案(某開源RAG方案) |
部署方式 | Serverless,API 即開即用 | 需自行部署系統,對機器有最低配置要求 |
相依元件 | 無需關心,底層 OSS/Tablestore 由雲平台全託管 | 需自行部署和營運 Elasticsearch、MySQL、Redis、MinIO 等組件 |
營運成本 | 零營運,容量自動彈性 | 需持續維護多個組件的升級、監控和故障恢複 |
計費模式 | 隨用隨付,零用量零費用 | 開源免費,但需承擔伺服器、儲存和頻寬成本 |
文檔處理 | 全自動(上傳→解析→切片→向量化→索引) | 需配置解析模板和切塊策略 |
資料安全 | 資料存放區在客戶自己的 OSS/Tablestore 賬戶 | 資料在自建伺服器上,安全性取決於營運水平 |
多租戶 | Subspace 原生支援,開箱即用 | 需自行設計隔離方案 |
Embedding | 內建百鍊模型(零配置),支援自訂模型 | 需自行配置模型 API Key |
配置參數複雜度 | 全部參數內建已調優的預設值,零配置開箱即用 | 參數眾多,需逐一學習、理解與配置,上手與調優成本高 |