全部產品
Search
文件中心

Platform For AI:PAI-RAG Web UI 配置指南

更新時間:Feb 28, 2026

本文介紹如何在PAI-RAG的Web 介面進行各項配置,包括知識庫、Code沙箱、模型、搜尋服務和MCP工具等。

配置模型

單擊左下角設定 > 模型,進入模型配置。在LLM頁簽添加模型。

說明

如果是一體化部署,會自動產生一條模型配置記錄。還可以繼續添加其他來源的模型。

  • 模型ID:區分不同的模型配置

  • Endpoint URL:填寫模型服務地址。

    說明
  • API Key:阿里雲百鍊參見擷取API Key填寫。EAS服務則填寫調用資訊中的Token。

  • 模型名稱:根據實際情況填寫。如果是EAS部署的LLM服務且推理引擎為vLLM,請務必填寫具體的模型名稱。可通過/v1/models介面擷取模型名稱。對於其他部署模式,則只需將模型名稱設定為default即可。

  • 多模態模型:如果是多模態模型,則勾選,否則不勾選(預設不勾選)。

  • 思考模型:有思考與非思考兩種模式的模型,可通過該選項來控制是否思考。預設不勾選。

image

配置成功後建議先測試模型配置。單擊左側建立對話,在對話頁面上方選擇模型進行對話測試。

image

配置MCP

單擊左下角設定 > MCP,如下添加MCP。

  • MCP連結:MCP 服務的完整訪問端點 URL。

  • MCP類型:支援 SSE / STDIO / Streamable HTTP。

  • Bearer Token:(可選)使用Bearer令牌認證,需填寫有效存取權杖。

image.png

配置搜尋

當知識庫內容不足以覆蓋使用者問題,或者需要即時資訊時,可以啟用搜尋服務(Tavily )作為補充。

單擊左下角設定 > 搜尋,進入搜尋配置。

Tavily搜尋

訪問 Tavily 官網註冊賬戶,並擷取API Key。

image.png

配置 Code 沙箱

Code沙箱提供安全的 Python 代碼運行環境。開啟 Code 沙箱功能後,當 AI 助手需要執行代碼時,會自動調用Code沙箱工具。

使用情境

  • 資料分析:執行資料統計、彙總、過濾等操作。例如:"幫我分析銷售資料,計算各地區的平均銷售額"。

  • 資料視覺效果:組建圖表、繪製趨勢圖等。例如:“繪製過去一年的銷售趨勢圖”。

  • 數學計算:執行複雜的數學運算、方程求解。例如:“計算這個數列的標準差”。

  • 檔案處理:解析CSV、Excel等檔案,提取和轉換資料。

  • 其他需要代碼執行的任務

前置準備

配置Code沙箱前需要完成以下準備工作:

  1. 開通Function Compute服務:訪問Function Compute控制台,按照提示開通服務。

  2. 建立AgentRun解譯器:訪問AgentRun控制台,左側導覽列選擇Sandbox 沙箱,建立沙箱模板,類型選擇代碼解譯器。注意:

    說明

    網路類型預設選擇允許預設網卡訪問公網,要求RAG服務能訪問公網。

    可以選擇允許訪問VPC,並確保與RAG服務配置同樣的專用網路。

  3. 擷取訪問憑證:擷取阿里雲帳號ID、沙箱 ID用於後續配置。如設定了訪問憑證還需API Key。

配置方式

單擊左下角設定 > Code沙箱,配置以下參數:

  • 啟用沙箱:開啟/關閉沙箱功能。

  • 沙箱類型:當前僅支援阿里雲FC沙箱。

  • 阿里雲ID:阿里雲帳號ID。

  • 解譯器ID:沙箱 ID。

  • 解譯器名稱:代碼解譯器名稱。

  • API Key:填寫存取金鑰,用於身分識別驗證。

  • 預設逾時(秒):代碼執行的最大時間長度(秒)。預設50秒。

image

設定檔分塊策略

分段設定用於配置知識庫中文檔的切片方式,決定文檔如何被切分成若干片段(chunk),以便後續做向量化與檢索。合理的分段設定能提升檢索命中率與回答品質。

支援知識庫和檔案層級的配置:

  • 知識庫分段設定:上傳到該知識庫的檔案在解析時會預設使用當前知識庫的分段設定。image

  • 指定檔案的分段設定:

    • 在上傳檔案時,可為該檔案單獨指定分段參數;image

    • 對已有檔案執行重新解析操作時,也可指定分段設定並觸發重新處理。image

前置要求

在使用分段設定之前,您需要:

  • 已建立知識庫:在系統中已有一個可用的知識庫。

  • 已配置 Embedding:系統內已添加至少一個向量(Embedding)模型。

  • (可選)多模態模型:若需使用圖片理解模型,需在系統中配置支援視覺的模型。

參數說明

參數

說明

切片類型

根據文檔特點選擇合適的切片類型:

  • 結構化 (structure):按文檔結構(如標題、段落)切片,適合大多數 Markdown、PDF、Word 等。

  • 按 token:按 token 數量切片,適合對長度有嚴格要求的情境。

  • 表格 (table):按表格結構切片,適合 Excel、CSV 等;可配置最大表頭行index合并行行分隔字元是否格式化為 JSON 等。

  • 段落 (paragraph):按自訂分隔字元(如 \n\n)切分為段落,可同時設定切片大小與切片重疊。

切片大小

每個切片的最大長度(字元數或 token 數,依類型而定)。推薦值:1000。

切片重疊

表相鄰切片之間重疊的長度,用於保留上下文、避免語義被截斷。推薦值:50。

重要

切片大小需大於切片重疊。

圖片理解模型

  • 用於理解文檔中的圖片內容(如 PDF 內嵌圖、帶圖 Markdown 等)。

  • 可選擇不使用圖片理解模型,或從下拉式清單中選擇已配置的視覺模型

  • 選擇後,解析文檔時會調用該模型對圖片進行理解並參與切片/檢索。

向量模型

  • 將切片文本及圖片理解結果轉換為向量的模型,檢索時依賴該向量。

  • 必須選擇系統已配置的 Embedding 模型(如 BAAI/bge-m3 等)。

說明

調優建議:建議先使用預設配置上傳少量文檔進行測試,通過評估模組分析召回率和準確率,再根據實際效果調整參數。

使用建議

  • 長文檔 RAG:設定切片類型為結構化、切片大小 1000、重疊 50,在保證內容相關的前提下控製片段長度。

  • 需要嚴格按照分隔字元切分文檔:使用段落 (paragraph)切分方式,自訂分隔字元號。

  • 表格式資料:切片類型選擇表格 (table) ,配置表頭行與行分隔字元,將 Excel/CSV 按行或按塊接入檢索,如果不勾選合并行選項,則是按照行切分,勾選合并行選項,可以按照切片大小的限制將行合并為塊。

  • 多模態文檔:開啟圖片理解模型,使 PDF、帶圖文檔中的圖片內容參與檢索與回答。

配置應用 FAQ

FAQ(常見問題)功能允許為每個應用維護一套問題-答案知識庫,適用於產品說明書、客服話術、常見問題等。

應用啟用FAQ功能並配置好條目後,在對話時,流程如下:

  1. AI 助手會優先從 FAQ 中檢索與使用者問題最相似的條目

  2. 若命中且滿足相似性閾值,將根據配置選擇直接返回 FAQ 答案結合 FAQ 結果由模型產生回答

  3. 若未命中或未啟用直接返回,則會繼續使用知識庫、搜尋等其它能力回答。

配置方式:

  1. 登入系統後,進入目標應用的配置頁。

  2. 啟用 FAQ:在應用配置中開啟啟用 FAQ開關並儲存。image

  3. 開啟FAQ管理,在 FAQ 管理頁面中可進行:

    • FAQ 回複設定:單擊設定按鈕,設定相似性的分數閾值(建議 0.8~1.0)、Embedding 模型、是否讓問題/答案參與檢索與展示、是否直接返回工具結果等。

      image.png

    • 維護 FAQ

      • 新增、編輯、刪除單條FAQ。image

      • 大量刪除image

      • 大量匯入:上傳 Excel 檔案,按列映射「問題列」「答案列」後一鍵匯入。image.png

  4. 儲存後,該應用的對話將自動優先使用 FAQ 檢索結果。