知識儲存（RAG）服務介紹、核心價值與應用情境 - Tablestore

通過知識儲存（RAG）服務，將文檔上傳後即可通過混合檢索為大語言模型（LLM）提供精準的上下文資訊。以下介紹知識儲存服務的定位、核心價值、典型應用情境和與開源方案的對比。

什麼是知識儲存（RAG）服務

知識儲存（RAG）服務是基於阿里雲Table Store（Tablestore）構建的全託管 RAG（Retrieval-Augmented Generation，檢索增強產生）服務。它為企業和開發人員提供了從文檔匯入、智能解析、自動切片、向量化到混合檢索的一站式能力，協助使用者快速構建高品質的知識檢索系統，為大語言模型（LLM）提供精準的上下文資訊。

知識儲存服務採用 Serverless 架構，使用者通過 API 即開即用，無需部署和維護任何物理伺服器或基礎設施。文檔上傳後，系統自動完成解析、切塊、構建索引等全部處理流程，使用者只需關注商務邏輯本身。

在典型的 AI 應用鏈路中，知識儲存服務處於核心的“知識管理與檢索”環節。

說明

當前支援地區：華北2（北京）、華東2（上海）、華東1（杭州）、華南1（深圳）、中國香港、新加坡。可就近選擇地區接入。

核心價值

Serverless，即開即用

知識儲存服務是完全的 Serverless 服務。使用者通過 API 呼叫即可建立知識庫、上傳文檔、執行檢索，無需購買和部署物理伺服器，無需關心底層資源的擴縮容。這意味著從零到生產環境可用，只需要幾行 API 呼叫，極大地降低了技術門檻和營運成本。

隨用隨付，零元起步

無最小規格、無最低消費。儲存與計算獨立隨用隨付，用多少付多少。業務低穀期近乎零成本，高峰期自動彈性擴充，徹底告別資源閑置浪費。

海量規模，彈性無上限

單個知識庫預設最大支援 1 億級文檔。無論是初創團隊的小規模試用，還是大型企業的海量知識管理，知識儲存服務都能從容應對。底層基於Table Store的分布式架構，天然具備水平擴充能力，業務增長無需擔憂容量瓶頸。

全託管知識庫流水線

文檔上傳後，系統自動完成文檔解析、智能切塊、Embedding 向量化、索引構建等全部處理流程。當前已支援 PDF、Word（doc/docx）、Excel（xls/xlsx）、PowerPoint（ppt/pptx）、純文字（txt）、Markdown（md）等主流文檔格式。使用者無需自行搭建文檔處理 Pipeline，無需管理 Embedding 模型的部署和營運，也無需手動構建和維護向量索引。整個知識庫的生命週期管理都由服務端自動完成。

資料自持，完全可控

整個流程中的未經處理資料、中間資料和結果資料都儲存在使用者自己的雲端服務帳號（OSS Bucket或Tablestore執行個體）內。服務本身不持有或轉存任何使用者資料。這種架構確保了資料的所有權和安全性完全掌握在客戶手中，滿足金融、政務、醫學等對資料合規性要求極高的行業需求。

靈活重排，精準召回

內建 RRF、加權融合、模型 Rerank 三種重排策略，可按業務情境靈活選用，對召回結果進行多維度精排，確保最相關的內容優先呈現。同時支援向量檢索與全文檢索索引雙通道混合召回——向量檢索捕捉語義相似性，全文檢索索引保障關鍵詞精確匹配，二者互補，最大化召回覆蓋面。

自主可控，開放定製

核心模組均支援客戶通過介面和參數進行控制與調整。從 Embedding 模型選擇（內建百鍊模型或自訂模型）、檢索策略配置（檢索類型、召回數量、Rerank 方式）、中繼資料過濾條件，到 Chunk 層級的內容修改和狀態管理，使用者可以根據業務需求精細調控知識庫的每一個環節。

典型應用情境

企業知識問答系統

將企業內部的產品文檔、技術手冊、FAQ、規章制度等匯入知識庫，結合 LLM 構建智能問答系統。員工或客戶提出問題時，系統從知識庫中檢索最相關的內容片段，交由 LLM 產生準確、有據可查的回答。適用於客服、HR、法務、IT 營運等多個部門。

文檔智能搜尋與摘要

替代傳統的關鍵詞搜尋引擎，利用向量檢索理解使用者的搜尋意圖，返回語義最相關的文檔片段。配合中繼資料過濾（按時間、分類、作者等維度篩選），實現精準的文檔檢索體驗。

多租戶 SaaS 知識庫

利用 Subspace 機制，在同一個知識庫內為不同租戶（使用者、部門、客戶）隔離資料。每個租戶只能檢索到自己 Subspace 下的文檔，天然實現資料隔離，無需為每個租戶建立獨立的知識庫，大幅降低管理複雜度和成本。

RAG Pipeline 整合

作為 RAG 架構中的檢索層，與 LangChain、LlamaIndex 等主流 AI 框架組成。使用者將文檔灌入知識庫，在推理階段調用 Retrieve 介面擷取相關上下文，拼接到 Prompt 中送入 LLM，實現知識增強產生效果。

合規文件管理與審計

金融、醫學、政務等行業的合規文件管理情境。所有資料存放區在客戶自己的雲賬戶內，滿足資料不出域的合規要求。通過中繼資料（metadata）標註文檔的分類、版本、有效期間等屬性，結合 Metadata Filter 實現精準的合規文檔檢索。

與開源方案對比

對比維度	知識儲存（RAG）服務	自建方案（某開源RAG方案）
部署方式	Serverless，API 即開即用	需自行部署系統，對機器有最低配置要求
相依元件	無需關心，底層 OSS/Tablestore 由雲平台全託管	需自行部署和營運 Elasticsearch、MySQL、Redis、MinIO 等組件
營運成本	零營運，容量自動彈性	需持續維護多個組件的升級、監控和故障恢複
計費模式	隨用隨付，零用量零費用	開源免費，但需承擔伺服器、儲存和頻寬成本
文檔處理	全自動（上傳→解析→切片→向量化→索引）	需配置解析模板和切塊策略
資料安全	資料存放區在客戶自己的 OSS/Tablestore 賬戶	資料在自建伺服器上，安全性取決於營運水平
多租戶	Subspace 原生支援，開箱即用	需自行設計隔離方案
Embedding	內建百鍊模型（零配置），支援自訂模型	需自行配置模型 API Key
配置參數複雜度	全部參數內建已調優的預設值，零配置開箱即用	參數眾多，需逐一學習、理解與配置，上手與調優成本高