大模型缺乏私人知識,且通用知識更新滯後。業界通常採用檢索增強產生(RAG)技術,根據使用者輸入從外部資訊源檢索相關資訊,然後將檢索到的內容整合到使用者輸入中,從而協助大模型產生更準確的回答。知識庫功能作為阿里雲百鍊的RAG能力,能有效補充私人知識並提供最新資訊。
無專屬知識庫的應用 在沒有專屬知識庫時,大模型無法準確回答特定領域的問題。
| 有專屬知識庫的應用 引入專屬知識庫後,大模型就能準確回答特定領域的問題。
|
支援的模型
以下模型可使用知識庫。配置通義千問使用知識庫教程
通義千問-Max/Plus/Turbo
通義千問VL-Max/Plus
通義千問-開源版(Qwen2.5等)
上述列表可能隨時更新。請以在應用管理頁面建立應用時實際可選的模型為準。
快速開始
本節介紹如何零代碼構建一個能回答特定領域問題(關於“阿里雲百鍊手機”)的大模型問答應用。
1. 構建知識庫
進入知識庫頁面,點擊建立知識庫。填寫知識庫名稱,其餘設定可保持預設,點擊下一步。
選擇預設類目,上傳阿里雲百鍊系列手機產品介紹.docx檔案。點擊下一步,然後點擊匯入完成。
2. 整合到業務應用
知識庫建立後,即可將其與具體的阿里雲百鍊應用(須與知識庫在同一業務空間下)或外部應用關聯,處理檢索請求。
整合到智能體應用
進入應用管理頁面,找到目標智能體應用,並點擊卡片上的配置。隨後,為應用選擇一個模型。

點擊頁面上文檔右側的+按鈕,添加在上一步中構建好的知識庫。相似性閾值和權重可保持預設。
在頁面右側的輸入框中發起提問,大模型將使用構建的知識庫進行回答。
例如:“請你幫我挑選一款拍照效果最好的阿里雲百鍊手機,價格在3000元以內。”
整合到工作流程應用
進入應用管理頁面,找到目標工作流程應用,並點擊卡片上的配置。隨後,將一個知識庫節點拖入畫布,並將其串連在開始節點之後。
配置知識庫節點:
輸入:在變數名
content右側的值下拉式清單中選擇。選擇知識庫:選擇在上一步中構建好的知識庫。
設定TopK(可選):它決定了返回給下遊節點(通常是大模型節點)的知識“數量”。
增大該值通常會提升大模型回答的準確性,但也會相應增加大模型的輸入Token消耗。
將一個大模型節點拖入畫布,並將其串連在知識庫節點之後,結束節點之前。
配置大模型節點:
在模型配置列表中,為節點選擇一個模型。
在提示詞中,輸入讓大模型使用知識庫的指令,需輸入“/”以插入
result變數(表示知識庫檢索返回的結果)。
配置結束節點:輸入
/,隨後選擇,輸出大模型返回的結果。點擊頁面右上方的測試,隨後在頁面右側的輸入框中發起提問,大模型將使用構建的知識庫進行回答。
例如:“請你幫我挑選一款拍照效果最好的阿里雲百鍊手機,價格在3000元以內。”
整合到外部應用
除了在阿里雲百鍊構建應用,知識庫的檢索能力可以通過阿里雲百鍊SDK調用,為外部 AI 應用提供檢索服務。
關於具體的整合步驟,請參見知識庫API指南。
3. 最佳化知識庫效果(可選)
在問答過程中,如遇到知識召回不完整或內容不準確的問題,請參見知識庫效果最佳化。
操作指南
知識庫ID:即每個知識庫卡片上的ID欄位的值,用於API調用等情境。建立知識庫
在知識庫頁面,點擊建立知識庫。
根據應用情境,選擇合適的知識庫類型(單一知識庫無法同時支援多個類型)。建立後,知識庫類型不可更改。
文檔搜尋(檢索情境)
適用情境:
適用於企業內部文檔、產品手冊等非結構化資料(未按某個預定義的表結構組織的資料,含文本、表格和圖片)的檢索。
若檔案包含圖片,且需阿里雲百鍊應用在回答中返回,請選擇文檔搜尋。
資料來源接入:支援本地上傳檔案,或從阿里雲Object Storage Service匯入。
資料查詢(Chatbot或NL2SQL情境)
適用情境:
適合構建基於結構化資料(按某個預定義的表結構組織的資料)的問答系統,例如FAQ/商品資料/人員資訊查詢助手。
若資料為完整的FAQ問答對,請選擇資料查詢。例如Excel檔案包含兩列,分別為
問題和答案。資料查詢類知識庫允許限定問題列用於知識庫檢索,答案列用於大模型回答參考。文檔搜尋類知識庫難以實現此效果。
匯入多個Excel檔案,且它們的表結構完全一致。
資料來源接入:支援本地上傳XLS或XLSX檔案。
圖片問答(圖搜情境)
適用情境:
適合構建以圖搜圖、以圖搜“圖+文字”的多模態檢索應用,如商品導購/視覺問答助手。
資料來源接入:支援本地上傳XLS或XLSX檔案。
XLS、XLSX 檔案中需包含公開可訪問的圖片 URL,以便構建圖片索引。詳見下方建立說明。
在請求高峰時段,整個建立過程可能需要數小時(取決於資料量大小),請耐心等待。
更新知識庫
知識庫內容的任何變更都會即時同步到所有引用它的應用中。
文檔搜尋類知識庫
自動更新(推薦)
可通過整合Object Storage Service、Function ComputeFC以及阿里雲百鍊知識庫相關的API實現。只需簡單幾步:
手動更新
在知識庫頁面,找到目標知識庫,並點擊卡片上的查看詳情。
如何新增檔案:單擊匯入資料,勾選應用資料中的已有檔案。如何上傳檔案至應用資料
如何刪除檔案:找到目標檔案後,單擊其右側的刪除。
此操作僅將檔案從知識庫中移除,不會刪除應用資料中的源檔案。
如何修改檔案內容:當前不支援對檔案進行原地更新及覆蓋上傳。需要先刪除知識庫中的檔案(舊版本),再將修改後的檔案(新版本)重新匯入知識庫。
注意:若保留舊版本檔案可能導致過時內容被檢索和召回。
資料查詢、圖片問答類知識庫
自動更新
不支援。
手動更新
當知識庫的資料來源是應用資料中的資料表時,只能手動更新,流程分為兩步。
步驟一:更新資料表
訪問應用資料頁簽。左側列表中選擇目標資料表,單擊匯入資料。
如何插入新資料:匯入類型選擇增量上傳。需上傳一個僅包含表頭和新增資料行的Excel檔案。
檔案的表頭須與當前表結構一致。可使用頁面上的下載模板功能,擷取標準表標頭檔,直接在該檔案中填入新資料。
如何刪除資料:匯入類型選擇覆蓋上傳。需上傳一個包含表頭及最新完整資料(已移除需刪除的記錄)的Excel檔案。
如何擷取全量資料:單擊頁面上的
下載XLSX格式資料。如何修改資料:匯入類型選擇覆蓋上傳。需上傳一個包含表頭及最新完整資料(已包含相應的修改)的Excel檔案。
步驟二:變更同步知識庫
返回知識庫列表,找到目標知識庫,並點擊卡片上的查看詳情。單擊資料表左上方的
表徵圖,確認後即可將資料表的最新內容同步到知識庫。後續每次更新後,仍需手動重複以上步驟(資料來源為“應用資料”的知識庫,資料變更無法自動同步)。
編輯知識庫
知識庫建立後,僅支援修改知識庫名稱、知識庫描述以及相似性閾值,其他配置均無法更改(除非刪除並重建一個新知識庫)。編輯操作僅支援通過控制台進行,無對應API。
操作步驟:在知識庫頁面,找到目標知識庫,並點擊卡片上的
後再點擊編輯。
刪除知識庫
本操作不會刪除應用資料中的源檔案/資料表。
刪除操作無法復原,請謹慎操作。
刪除知識庫前,必須先將其與所有發行的阿里雲百鍊應用解除關聯。
關聯的未發布應用不會影響刪除操作。
點擊測試
想象一下,您已構建了一個知識庫,但在實際使用中發現 AI 應用經常答非所問,或者找不到知識庫中已有的資訊。點擊測試就是幫您提前發現並解決這些問題的關鍵工具。
通過點擊測試,您可以:
驗證知識庫是否能為 AI 應用提供有效知識輸入
調優相似性閾值,平衡召回率和準確性
發現知識庫中的內容缺失或品質問題
情境樣本
情境1:客戶諮詢產品價格
測試輸入:“你們的阿里雲百鍊手機多少錢?” 期望結果:能夠召回包含價格資訊的相關文本切片。情境2:技術問題排查
測試輸入:“裝置連不上WiFi怎麼辦?” 期望結果:能夠召回WiFi串連故障排除的相關文本切片。
操作步驟
在知識庫頁面,找到目標知識庫,點擊卡片上的點擊測試。
在測試介面輸入問題(建議提前收集使用者常問的問題),觀察召回結果。
召回結果:即本次測試的命中結果(已按相似性降序排列),點擊任一切片即可查看其具體內容。
表徵圖:若為圖片問答類知識庫,系統會先將輸入圖片轉為向量並檢索到相關記錄,然後將這些記錄與提問一起交給大模型產生回答;若為文檔搜尋或資料查詢類知識庫,上傳的圖片不會參與檢索。
確認相關文本切片是否被正確召回,否則需要調整相似性閾值,並重複上一步。
點擊查看歷史召回記錄,可以對比過往不同閾值設定下的召回效果。
配額與限制
關於知識庫支援的資料來源與容量等資訊,請參見知識庫配額與限制。
單個阿里雲百鍊應用可關聯的知識庫上限:
文檔搜尋類:最多5個
資料查詢類:最多5個
圖片問答類:最多1個
不同類型的知識庫可同時關聯,總數最多為11個。
計費說明
知識庫功能本身不收費,但在調用引用了知識庫的阿里雲百鍊應用時,可能會產生費用。
步驟 | 計費情況 | |
不收費。 | ||
調用阿里雲百鍊應用時,從知識庫召回的文本切片會增加大模型輸入Token數量,這可能導致模型推理(調用)費用的增加。關於模型推理(調用)的費用詳情,請參見計費項目與定價。 注意:如果僅在指定的知識庫中進行檢索,不經過阿里雲百鍊應用進行產生(通過調用Retrieve介面的方式),則不產生費用。 | ||
不收費。 | ||
API參考
擷取最新完整的知識庫API列表及輸入輸出參數,請參見API目錄(知識庫)。
相關API的具體使用方法和程式碼範例,請參見知識庫API指南。


















