全部產品
Search
文件中心

Alibaba Cloud Model Studio:知識庫

更新時間:Dec 05, 2025

大模型缺乏私人知識,且通用知識更新滯後。業界通常採用檢索增強產生(RAG)技術,根據使用者輸入從外部資訊源檢索相關資訊,然後將檢索到的內容整合到使用者輸入中,從而協助大模型產生更準確的回答。知識庫功能作為阿里雲百鍊的RAG能力,能有效補充私人知識並提供最新資訊。

重要

無專屬知識庫的應用

在沒有專屬知識庫時,大模型無法準確回答特定領域的問題。

無

有專屬知識庫的應用

引入專屬知識庫後,大模型就能準確回答特定領域的問題。

有

支援的模型

以下模型可使用知識庫。配置通義千問使用知識庫教程

  • 通義千問-Max/Plus/Turbo

  • 通義千問VL-Max/Plus

  • 通義千問-開源版(Qwen2.5等)

上述列表可能隨時更新。請以在應用管理頁面建立應用時實際可選的模型為準。

快速開始

本節介紹如何零代碼構建一個能回答特定領域問題(關於“阿里雲百鍊手機”)的大模型問答應用。

1. 構建知識庫

  1. 進入知識庫頁面,點擊建立知識庫。填寫知識庫名稱,其餘設定可保持預設,點擊下一步

  2. 選擇預設類目,上傳阿里雲百鍊系列手機產品介紹.docx檔案。點擊下一步,然後點擊匯入完成

2. 整合到業務應用

知識庫建立後,即可將其與具體的阿里雲百鍊應用(須與知識庫在同一業務空間下)或外部應用關聯,處理檢索請求。

整合到智能體應用

  1. 進入應用管理頁面,找到目標智能體應用,並點擊卡片上的配置。隨後,為應用選擇一個模型。

    image

  2. 點擊頁面上文檔右側的+按鈕,添加在上一步中構建好的知識庫。相似性閾值和權重可保持預設。

    (可選)相似性閾值:篩選檢索結果

    知識庫採用語義檢索,能在給定的私人資料或檔案中找出與查詢意圖相關但關鍵詞可能完全不同的文本。

    例如,使用者查詢: 哪款阿里雲手機適合拍照?

    然而實際答案(通義Vivid 7...)並沒有包含使用者查詢中的任何關鍵詞。

    下表中的關鍵詞相似性基於Jaccard計算, 語義相似性基於text-embedding-v4模型計算的Cosine相似性

    召迴文本

    關鍵詞相似性

    語義相似性

    通義Vivid 7:智能攝影新體驗

    0

    0.43

    阿里雲百鍊Ace Ultra:遊戲玩家之選

    0.17

    0.32

    阿里雲百鍊Flex Fold+:摺疊屏新紀元

    0.25

    0.24

    相似性閾值:只有語義相似性得分高於此值的文本才會被召回。若此值設定得過高,將導致知識庫丟棄所有相關的文本。

    (可選)權重:幹預多知識庫召回順序

    當智能體應用同時關聯多個知識庫時,可按資訊源的重要性/等級為每個知識庫分配權重。在多路召回時,若多個知識庫召回的文本切片相似性分數相同,系統將優先返回權重更高的知識庫中的文本切片

    • 關鍵限制:權重僅在同類型知識庫之間生效。例如:文檔搜尋類知識庫的權重不影響資料查詢類知識庫的召回順序,反之亦然。

    • 工作原理:系統首先計算使用者問題與各個知識庫中內容的相關度,篩選出最相關的文本切片。接著,將這些文本切片的相似性分數與對應知識庫的權重相乘。經加權重排後,最終提供給大模型回答參考(加權後得分越高,越可能被採納)。

  3. 在頁面右側的輸入框中發起提問,大模型將使用構建的知識庫進行回答。

    例如:“請你幫我挑選一款拍照效果最好的阿里雲百鍊手機,價格在3000元以內。”

整合到工作流程應用

  1. 進入應用管理頁面,找到目標工作流程應用,並點擊卡片上的配置。隨後,將一個知識庫節點拖入畫布,並將其串連在開始節點之後。

  2. 配置知識庫節點:

    1. 輸入:在變數名content右側的下拉式清單中選擇內建變數 > query

    2. 選擇知識庫:選擇在上一步中構建好的知識庫。

    3. 設定TopK(可選):它決定了返回給下遊節點(通常是大模型節點)的知識“數量”。

      增大該值通常會提升大模型回答的準確性,但也會相應增加大模型的輸入Token消耗。
  3. 將一個大模型節點拖入畫布,並將其串連在知識庫節點之後,結束節點之前。

  4. 配置大模型節點:

    1. 模型配置列表中,為節點選擇一個模型。

    2. 提示詞中,輸入讓大模型使用知識庫的指令,需輸入“/”以插入result變數(表示知識庫檢索返回的結果)。

      image

  5. 配置結束節點:輸入/,隨後選擇大模型1 > result,輸出大模型返回的結果。

  6. 點擊頁面右上方的測試,隨後在頁面右側的輸入框中發起提問,大模型將使用構建的知識庫進行回答。

    例如:“請你幫我挑選一款拍照效果最好的阿里雲百鍊手機,價格在3000元以內。”

整合到外部應用

除了在阿里雲百鍊構建應用,知識庫的檢索能力可以通過阿里雲百鍊SDK調用,為外部 AI 應用提供檢索服務。

關於具體的整合步驟,請參見知識庫API指南

3. 最佳化知識庫效果(可選)

在問答過程中,如遇到知識召回不完整或內容不準確的問題,請參見知識庫效果最佳化

操作指南

知識庫頁面,可查看和管理當前業務空間下的所有知識庫。

知識庫ID:即每個知識庫卡片上的ID欄位的值,用於API調用等情境。

建立知識庫

  1. 知識庫頁面,點擊建立知識庫

  2. 根據應用情境,選擇合適的知識庫類型(單一知識庫無法同時支援多個類型)。建立後,知識庫類型不可更改。

    • 文檔搜尋(檢索情境)

      • 適用情境:

      • 資料來源接入:支援本地上傳檔案,或從阿里雲Object Storage Service匯入

        建立說明(文檔搜尋)

        1. 選擇資料:為知識庫指定資料來源(含檔案或內容)。資料來源內容將匯入知識庫,用於後續檢索。支援本地上傳雲端匯入(選擇現有類目或檔案)兩種方式。

          • 本地上傳:直接從您的電腦上傳檔案。展開下方摺疊面板瞭解如何選擇解析方式。

            資料解析設定說明

            請根據實際需求配置解析策略,如不確定建議保持預設設定。

            • 電子文檔解析:不支援解析檔案中的插圖與圖表。

            • 文檔智能解析:對於檔案中的插圖,解析器會識別並提取圖中的文本,並產生文本摘要。這些摘要將與檔案中其它非圖片內容一起被切分並轉換為向量,參與知識庫的檢索。

            • 大模型文檔解析:使用通義千問VL模型的智能體應用支援使用者對檔案中插圖和圖表的內容進行提問。如需識別和理解檔案中的插圖與圖表,請選擇大模型文檔解析

            • Qwen VL解析:專用於圖片檔案。可指定通義千問VL模型並傳入Prompt,以指導對圖片版面、元素的識別與提取。

            image

            image

          • 雲端匯入:從阿里雲百鍊應用資料或Object Storage Service匯入已有檔案。操作說明詳見資料匯入

        2. 索引配置:定義匯入資料的處理和儲存方式,直接影響檢索效果。

          以下配置項中,僅“向量儲存”選用 ADB-PG 可能產生費用,其餘配置均免費。

          Meta資訊抽取

          metadata(中繼資料)是與非結構化資料相關的一系列附加屬性,這些屬性以key-value索引值對的形式整合到文本切片中。

          • 作用:中繼資料為文本切片提供了重要的上下文資訊,可顯著提升知識庫檢索的準確性。例如,某知識庫包含了上千個產品介紹檔案,且檔案名稱為產品名稱。當在知識庫中檢索“A產品的功能概述”時,如果所有檔案的本文內容都包含“功能概述”,但均沒有提到“A產品”,那麼知識庫可能會召回大量與原始查詢無關的文本切片。若將產品名稱作為中繼資料附加到該知識庫的所有文本切片上,知識庫就能精準地過濾出與“A產品”相關的且包含“功能概述”的文本切片,從而提高檢索的準確性,同時減少模型的輸入Token消耗。

          • 用法:通過API調用應用時,可在請求參數metadata_filter中指定metadata。應用在檢索知識庫時,會先根據metadata篩選相關檔案。

          • 注意:知識庫一旦建立,無法再配置metadata抽取

          如何配置metadata

          開啟metadata抽取,然後單擊meta資訊設定為該知識庫中的所有檔案附加統一或個人化的中繼資料。在切分時,每個檔案的中繼資料都會整合到各自的文本切片中。下圖是上方樣本使用的meta資訊模板:

          image

          建立Meta資訊模板說明

          取值方法說明:

          • 常量:為知識庫中的所有檔案附加一個固定的屬性。

            如上方樣本所示,如果知識庫中所有檔案的作者相同,可統一設定一個欄位名為author的常量。
          • 變數:為知識庫中的每個檔案附加一個可變屬性。目前支援的屬性包括file_namecat_name。選擇file_name時,阿里雲百鍊會將檔案的名稱附加到其中繼資料中,如上方樣本所示。選擇cat_name時,阿里雲百鍊會把檔案所在類目的名稱附加到檔案的中繼資料中。

          • 大模型:系統將依據設定的實體描述規則,對知識庫中每個檔案的常值內容進行匹配。系統會自動識別並提取檔案中的相關資訊,然後將這些資訊作為屬性附加到檔案的中繼資料中。

            如上方樣本的meta資訊模板所示,如需提取每個檔案中所有出現過的年份資訊作為檔案的屬性,可以設定一個名為date的大模型欄位,實體描述配置如下:

            image

          • 正則:系統將根據設定的Regex,對知識庫中每個檔案的常值內容進行匹配。符合該運算式的內容將被提取,並作為屬性添加到檔案的中繼資料中。

            如上方樣本的meta資訊模板所示,如需提取每個檔案中所有出現過的參考資料,並且假設參考資料規律為:以“《”開頭、以“》”結尾,則可以設定一個名為reference的正則欄位,Regex配置如下:

            image

          • 關鍵詞搜尋:系統會在每個檔案中尋找預設的關鍵詞,並將找到的關鍵詞作為屬性添加至該檔案的中繼資料中。

            例如,在上述樣本的meta資訊模板中,我們預設的關鍵詞為:

            image

            但由於該檔案中僅出現了“融資、產業、綠色、資本”這四個關鍵詞,因此系統只提取了這四個關鍵詞作為該檔案keywords屬性的值。

          是否參與檢索:開啟後,中繼資料欄位和值將和文本切片的內容一同參與知識庫檢索;不開啟時,僅文本切片的內容參與檢索,中繼資料欄位和值不參與。

          是否參與模型回複:開啟後,中繼資料欄位和值將和文本切片的內容一同參與大模型的回答產生過程;不開啟時,僅文本切片的內容參與大模型的回答產生過程,中繼資料欄位和值不參與。

          Excel檔案表頭拼裝

          開啟後,知識庫會將所有XLSX、XLS格式檔案的首行資料視為表頭,並自動拼接到每個文本切片中(資料行),避免大模型誤將表頭視為普通資料行來處理。

          若知識庫中包含其他格式的檔案(如PDF),該設定無需開啟。

          切片方式

          選擇智能切分(推薦)

          作用:知識庫會將檔案切分成文本切片,並將這些文本切片通過向量模型轉換為向量。隨後文本切片和向量將以索引值對的形式存入向量資料庫中。知識庫建立後,可查看或編輯每一個文本切片的具體內容(文字和圖片)。
          注意:知識庫一旦建立,無法再更改文檔切分chunk。不合適的切分策略可能會降低檢索和召回效果。

          多輪對話改寫

          開啟該功能後,系統將調用一個專用的輕量級模型,結合對話歷史將使用者當前的問題改寫為一個獨立的、上下文完整的新查詢,再用於知識庫檢索。

          向量模型

          向量模型用於將原始輸入Prompt和知識文本轉化為數值化向量,以便計算它們之間的語義相似性。預設的DashScope text-embedding-v2模型(暫不支援更改)除了支援中英文雙語外,還支援多種語言,並對向量結果進行歸一化處理。

          知識庫使用的向量維度(無法修改):

          • text-embedding-v2:1,536維

          排序模型

          排序模型是位於知識庫外部的評分系統,它會對向量檢索初步召回的候選切片進行二次排序,並返回相似性分數最高的前K個文本切片。官方排序(推薦)融合了語義相關性與關鍵詞匹配演算法(如BM25),能更好地處理需要精確關鍵詞命中的查詢;若只需語義排序,請選擇GTE-ReRank排序

          相似性閾值

          該閾值表示允許召回的文本切片的最低相似性分數,用於篩選排序模型返回的文本切片,即只有分數超過此數值的文本切片才會被召回。

          說明

          此處設定的是知識庫的預設相似性閾值。在將知識庫關聯到具體阿里雲百鍊應用時,還可為該應用單獨設定一個閾值(將覆蓋知識庫的預設相似性閾值)。

          調低此閾值預期會召回更多文本切片,但可能召回一些相關度較低的文本切片;提高此閾值會減少召回的文本切片。若設定得過高,將導致知識庫丟棄相關的文本切片。

          可通過點擊測試對相似性閾值進行調優,以平衡召回率與精確率。

          最大召回數量

          假設阿里雲百鍊應用關聯了A1、A2和A3三個知識庫,系統會從這些庫中檢索與原始輸入相關的切片,再通過排序模型重排序,選出最相關的前K條加入到大模型的輸入Token中用於其回答時參考。此K值便是最大召回數量(上限為20)。它決定了排序模型提供給大模型參考的文本切片數量。

          增大該值可提高大模型的回答準確性,但也會相應增加大模型輸入Token消耗。

          向量儲存

          選擇向量資料庫儲存文本向量。平台儲存的向量資料庫足以滿足知識庫的準系統需求。如需進階功能,如管理、審計或監控資料庫,建議選擇ADB-PG(AnalyticDB for PostgreSQL)。

          請注意,購買ADB-PG執行個體時請開啟向量引擎最佳化,否則阿里雲百鍊將無法使用此執行個體。
    • 資料查詢(Chatbot或NL2SQL情境)

      • 適用情境:

        • 適合構建基於結構化資料(按某個預定義的表結構組織的資料)的問答系統,例如FAQ/商品資料/人員資訊查詢助手。

        • 若資料為完整的FAQ問答對,請選擇資料查詢。例如Excel檔案包含兩列,分別為問題答案。資料查詢類知識庫允許限定問題列用於知識庫檢索,答案列用於大模型回答參考。

          文檔搜尋類知識庫難以實現此效果。
        • 匯入多個Excel檔案,且它們的表結構完全一致

      • 資料來源接入:支援本地上傳XLS或XLSX檔案。

        建立說明(資料查詢)

        1. 選擇資料:為知識庫指定資料來源(含檔案或內容)。資料來源內容將匯入知識庫,用於後續檢索。支援本地上傳雲端匯入(選擇應用資料中已有資料表)兩種方式。

          說明

          知識庫建立後資料來源不可更改,且單一知識庫無法同時支援多個資料來源。

          • 本地上傳:直接從您的電腦上傳資料表(XLS或XLSX格式,且首行必須為表頭)。

          • 雲端匯入(選擇資料表):選擇阿里雲百鍊應用資料中現有的資料表。操作指南請參見資料匯入

        2. 索引配置:定義匯入資料的處理和儲存方式,直接影響檢索效果。

          以下配置項中,僅“向量儲存”選用 ADB-PG 可能產生費用,其餘配置均免費。

          是否參與檢索/參與模型回複

          • 是否參與檢索:開啟後表示允許知識庫在此列資料中進行搜尋。

          • 是否參與模型回複:開啟後表示本列的檢索結果將作為大模型產生回答時的輸入資訊。如下圖樣本的配置中,對“姓名”、“性別”、“崗位”、“年齡”開啟是否參與檢索,對“姓名”和“崗位”開啟是否參與模型回複後, 知識庫將會在所有列資料中進行檢索,但只對檢索到的資料中“姓名”、“崗位”兩列的內容提供給大模型進行回答參考。

            image

            如下圖所示,因為“年齡”沒有開啟參與模型回複,大模型在關聯該知識庫後依然無法回答“張三的年齡”的問題。

            image

          多輪對話改寫

          開啟該功能後,系統將調用一個專用的輕量級模型,結合對話歷史將使用者當前的問題改寫為一個獨立的、上下文完整的新查詢,再用於知識庫檢索。

          向量模型

          向量模型用於將原始輸入Prompt和知識文本轉化為數值化向量,以便計算它們之間的語義相似性。預設的DashScope text-embedding-v2模型(暫不支援更改)除了支援中英文雙語外,還支援多種語言,並對向量結果進行歸一化處理。

          知識庫使用的向量維度(無法修改):

          • text-embedding-v2:1,536維

          排序模型

          排序模型是位於知識庫外部的評分系統,它會對向量檢索初步召回的候選切片進行二次排序,並返回相似性分數最高的前K個文本切片。官方排序(推薦)融合了語義相關性與關鍵詞匹配演算法(如BM25),能更好地處理需要精確關鍵詞命中的查詢;若只需語義排序,請選擇GTE-ReRank排序

          相似性閾值

          該閾值表示允許召回的文本切片的最低相似性分數,用於篩選排序模型返回的文本切片,即只有分數超過此數值的文本切片才會被召回。

          說明

          此處設定的是知識庫的預設相似性閾值。在將知識庫關聯到具體阿里雲百鍊應用時,還可為該應用單獨設定一個閾值(將覆蓋知識庫的預設相似性閾值)。

          調低此閾值預期會召回更多文本切片,但可能召回一些相關度較低的文本切片;提高此閾值會減少召回的文本切片。若設定得過高,將導致知識庫丟棄相關的文本切片。

          可通過點擊測試對相似性閾值進行調優,以平衡召回率與精確率。

          最大召回數量

          假設阿里雲百鍊應用關聯了A1、A2和A3三個知識庫,系統會從這些庫中檢索與原始輸入相關的切片,再通過排序模型重排序,選出最相關的前K條加入到大模型的輸入Token中用於其回答時參考。此K值便是最大召回數量(上限為20)。它決定了排序模型提供給大模型參考的文本切片數量。

          增大該值可提高大模型的回答準確性,但也會相應增加大模型輸入Token消耗。

          向量儲存

          選擇向量資料庫儲存文本向量。平台儲存的向量資料庫足以滿足知識庫的準系統需求。如需進階功能,如管理、審計或監控資料庫,建議選擇ADB-PG(AnalyticDB for PostgreSQL)。

          請注意,購買ADB-PG執行個體時請開啟向量引擎最佳化,否則阿里雲百鍊將無法使用此執行個體。
    • 圖片問答(圖搜情境)

      • 適用情境:

        • 適合構建以圖搜圖、以圖搜“圖+文字”的多模態檢索應用,如商品導購/視覺問答助手。

      • 資料來源接入:支援本地上傳XLS或XLSX檔案。

        XLS、XLSX 檔案中需包含公開可訪問的圖片 URL,以便構建圖片索引。詳見下方建立說明。

        建立說明(圖片問答)

        1. 選擇資料:為知識庫指定資料來源(含檔案或內容)。資料來源內容將匯入知識庫,用於後續檢索。支援本地上傳雲端匯入(選擇應用資料中已有資料表)兩種方式。

          說明

          知識庫建立後資料來源不可更改,且單一知識庫無法同時支援多個資料來源。

          • 本地上傳:直接從您的電腦上傳資料表(XLS或XLSX格式)。

            說明
            • 欄位:資料表應至少包含一個類型為 image_url 的欄位,用於產生圖片索引。

            • 構建過程:知識庫會訪問image_url欄位中的圖片 URL,提取視覺特徵,並將其轉換為向量儲存。

            • 檢索過程:知識庫會對使用者上傳圖片產生的向量與已儲存的圖片向量進行相似性比對,返回最相關的記錄。

          • 雲端匯入(選擇資料表):選擇阿里雲百鍊應用資料中現有的資料表。如何操作,請參見資料匯入

        2. 索引配置:定義匯入資料的處理和儲存方式,直接影響檢索效果。

          以下配置項中,僅“向量儲存”選用 ADB-PG 可能產生費用,其餘配置均免費。

          是否參與檢索/參與模型回複

          • 是否參與檢索:開啟後表示允許知識庫在此列資料中進行搜尋。

          • 是否參與模型回複:開啟後表示本列的檢索結果將作為大模型產生回答時的輸入資訊。如下圖樣本的配置中,對“姓名”、“性別”、“崗位”、“年齡”開啟是否參與檢索,對“姓名”和“崗位”開啟是否參與模型回複後, 知識庫將會在所有列資料中進行檢索,但只對檢索到的資料中“姓名”、“崗位”兩列的內容提供給大模型進行回答參考。

            image

            如下圖所示,因為“年齡”沒有開啟參與模型回複,大模型在關聯該知識庫後依然無法回答“張三的年齡”的問題。

            image

          多輪對話改寫

          開啟該功能後,系統將調用一個專用的輕量級模型,結合對話歷史將使用者當前的問題改寫為一個獨立的、上下文完整的新查詢,再用於知識庫檢索。

          向量模型

          向量模型用於將原始輸入Prompt、知識文本及圖片轉化為數值化向量,以便對二者進行相似性比較。預設的多模態向量v1(multimodal-embedding-v1)模型(暫不支援更改)支援中英文雙語及多種圖片、視頻格式,並對向量結果進行歸一化處理,適用於大部分情境。詳情請參見文本與多模態向量化

          排序模型

          排序模型是位於知識庫外部的評分系統,它會對向量檢索初步召回的候選切片進行二次排序,並返回相似性分數最高的前K個文本切片。官方排序(推薦)融合了語義相關性與關鍵詞匹配演算法(如BM25),能更好地處理需要精確關鍵詞命中的查詢;若只需語義排序,請選擇GTE-ReRank排序

          相似性閾值

          該閾值表示允許召回的文本切片的最低相似性分數,用於篩選排序模型返回的文本切片,即只有分數超過此數值的文本切片才會被召回。

          說明

          此處設定的是知識庫的預設相似性閾值。在將知識庫關聯到具體阿里雲百鍊應用時,還可為該應用單獨設定一個閾值(將覆蓋知識庫的預設相似性閾值)。

          調低此閾值預期會召回更多文本切片,但可能召回一些相關度較低的文本切片;提高此閾值會減少召回的文本切片。若設定得過高,將導致知識庫丟棄相關的文本切片。

          可通過點擊測試對相似性閾值進行調優,以平衡召回率與精確率。

          最大召回數量

          假設阿里雲百鍊應用關聯了A1、A2和A3三個知識庫,系統會從這些庫中檢索與原始輸入相關的切片,再通過排序模型重排序,選出最相關的前K條加入到大模型的輸入Token中用於其回答時參考。此K值便是最大召回數量(上限為20)。它決定了排序模型提供給大模型參考的文本切片數量。

          增大該值可提高大模型的回答準確性,但也會相應增加大模型輸入Token消耗。

          向量儲存

          選擇向量資料庫儲存文本向量。平台儲存的向量資料庫足以滿足知識庫的準系統需求。如需進階功能,如管理、審計或監控資料庫,建議選擇ADB-PG(AnalyticDB for PostgreSQL)。

          請注意,購買ADB-PG執行個體時請開啟向量引擎最佳化,否則阿里雲百鍊將無法使用此執行個體。
  3. 在請求高峰時段,整個建立過程可能需要數小時(取決於資料量大小),請耐心等待。

更新知識庫

知識庫內容的任何變更都會即時同步到所有引用它的應用中。

文檔搜尋類知識庫

  • 自動更新(推薦)

    可通過整合Object Storage Service、Function ComputeFC以及阿里雲百鍊知識庫相關的API實現。只需簡單幾步:

    1. 建立Bucket:前往OSS控制台,建立一個OSS Bucket用於儲存原始檔案。

    2. 建立知識庫:建立一個非結構化知識庫,用於儲存私人知識內容。

    3. 建立自訂函數:前往FC控制台,針對檔案變更類事件(例如新增、刪除等操作)建立函數,具體操作請參見建立函數。這些函數通過調用知識庫API指南的相關API,將OSS上發生的檔案變更同步至已建立的知識庫中。

    4. 建立OSS觸發器:在FC中,為上一步建立的自訂函數關聯OSS觸發器。當捕獲到檔案變更類的事件後(例如有新檔案上傳至OSS時),相應的觸發器會被啟用,觸發FC執行相應函數。

  • 手動更新

    知識庫頁面,找到目標知識庫,並點擊卡片上的查看詳情

    • 如何新增檔案:單擊匯入資料,勾選應用資料中的已有檔案。如何上傳檔案至應用資料

    • 如何刪除檔案:找到目標檔案後,單擊其右側的刪除

      此操作僅將檔案從知識庫中移除,不會刪除應用資料中的源檔案。
    • 如何修改檔案內容:當前不支援對檔案進行原地更新及覆蓋上傳。需要先刪除知識庫中的檔案(舊版本),再將修改後的檔案(新版本)重新匯入知識庫。

      注意:若保留舊版本檔案可能導致過時內容被檢索和召回。

資料查詢、圖片問答類知識庫

  • 自動更新

    不支援。

  • 手動更新

    當知識庫的資料來源是應用資料中的資料表時,只能手動更新,流程分為兩步。

    1. 步驟一:更新資料表

      訪問應用資料頁簽。左側列表中選擇目標資料表,單擊匯入資料

      • 如何插入新資料:匯入類型選擇增量上傳。需上傳一個僅包含表頭和新增資料行的Excel檔案。

        檔案的表頭須與當前表結構一致。可使用頁面上的下載模板功能,擷取標準表標頭檔,直接在該檔案中填入新資料。
      • 如何刪除資料:匯入類型選擇覆蓋上傳。需上傳一個包含表頭及最新完整資料(已移除需刪除的記錄)的Excel檔案。

        如何擷取全量資料:單擊頁面上的image下載XLSX格式資料。
      • 如何修改資料:匯入類型選擇覆蓋上傳。需上傳一個包含表頭及最新完整資料(已包含相應的修改)的Excel檔案。

    2. 步驟二:變更同步知識庫

      返回知識庫列表,找到目標知識庫,並點擊卡片上的查看詳情。單擊資料表左上方的image表徵圖,確認後即可將資料表的最新內容同步到知識庫。

      後續每次更新後,仍需手動重複以上步驟(資料來源為“應用資料”的知識庫,資料變更無法自動同步)。

編輯知識庫

知識庫建立後,僅支援修改知識庫名稱知識庫描述以及相似性閾值,其他配置均無法更改(除非刪除並重建一個新知識庫)。編輯操作僅支援通過控制台進行,無對應API

操作步驟:知識庫頁面,找到目標知識庫,並點擊卡片上的image後再點擊編輯

刪除知識庫

說明

本操作不會刪除應用資料中的源檔案/資料表。

警告

刪除操作無法復原,請謹慎操作。

刪除知識庫前,必須先將其與所有發行的阿里雲百鍊應用解除關聯。

關聯的未發布應用不會影響刪除操作。

刪除知識庫步驟

  1. 對每一個關聯了該知識庫的發行應用,迴圈執行以下操作:

    1. 應用管理頁面,找到關聯該知識庫的應用,單擊配置

    2. 在知識庫列表中移除該知識庫。單擊頁面右上方的發布,根據指引重新發布應用。

  2. 知識庫頁面,找到目標知識庫,並點擊卡片上的image後再點擊刪除

點擊測試

想象一下,您已構建了一個知識庫,但在實際使用中發現 AI 應用經常答非所問,或者找不到知識庫中已有的資訊。點擊測試就是幫您提前發現並解決這些問題的關鍵工具。

通過點擊測試,您可以:

  • 驗證知識庫是否能為 AI 應用提供有效知識輸入

  • 調優相似性閾值,平衡召回率和準確性

  • 發現知識庫中的內容缺失或品質問題

情境樣本

  • 情境1:客戶諮詢產品價格

    測試輸入:“你們的阿里雲百鍊手機多少錢?”
    期望結果:能夠召回包含價格資訊的相關文本切片。
  • 情境2:技術問題排查

    測試輸入:“裝置連不上WiFi怎麼辦?”
    期望結果:能夠召回WiFi串連故障排除的相關文本切片。

操作步驟

  1. 知識庫頁面,找到目標知識庫,點擊卡片上的點擊測試

  2. 在測試介面輸入問題(建議提前收集使用者常問的問題),觀察召回結果。

    • 召回結果:即本次測試的命中結果(已按相似性降序排列),點擊任一切片即可查看其具體內容。

    • image表徵圖:若為圖片問答類知識庫,系統會先將輸入圖片轉為向量並檢索到相關記錄,然後將這些記錄與提問一起交給大模型產生回答;若為文檔搜尋或資料查詢類知識庫,上傳的圖片不會參與檢索。

  3. 確認相關文本切片是否被正確召回,否則需要調整相似性閾值,並重複上一步。

  4. 點擊查看歷史召回記錄,可以對比過往不同閾值設定下的召回效果。

image

配額與限制

  • 關於知識庫支援的資料來源與容量等資訊,請參見知識庫配額與限制

  • 單個阿里雲百鍊應用可關聯的知識庫上限:

    • 文檔搜尋類:最多5

    • 資料查詢類:最多5

    • 圖片問答類:最多1

    不同類型的知識庫可同時關聯,總數最多為11個。

計費說明

知識庫功能本身不收費,但在調用引用了知識庫的阿里雲百鍊應用時,可能會產生費用。

步驟

計費情況

構建知識庫

不收費。

整合到業務應用

調用阿里雲百鍊應用時,從知識庫召回的文本切片會增加大模型輸入Token數量,這可能導致模型推理(調用)費用的增加。關於模型推理(調用)的費用詳情,請參見計費項目與定價

注意:如果僅在指定的知識庫中進行檢索,不經過阿里雲百鍊應用進行產生(通過調用Retrieve介面的方式),則不產生費用。

管理與營運

不收費。

API參考

常見問題

構建知識庫

  • Q: 應用資料中已匯入知識庫的檔案/資料表能否刪除?

    • 文檔搜尋類知識庫:可以刪除,應用資料和知識庫中的檔案互為獨立的資料副本,刪除應用資料中的源檔案不會影響已匯入知識庫的檔案。

    • 資料查詢、圖片問答類知識庫:不可刪除,否則將導致資料同步、查看知識庫等功能異常。

處理圖片及多模態內容

  • Q: 檔案含插圖(需阿里雲百鍊應用在回答時返回),應如何處理?

    使用文檔搜尋類知識庫

    方式一(僅適用智能體應用)

    1. 構建知識庫時,知識庫類型選擇文檔搜尋,使用情境選擇圖文並茂回複

      選擇圖文並茂回複,知識庫將從檔案插圖中提取摘要,大模型會根據摘要與問題的相關性自主決定是否插入圖片。

      image

    2. 在建立/編輯智能體應用時,選擇通義千問-Plus通義千問-Plus-Latest模型(經測試,這兩款效果最佳)。點擊頁面上文檔右側的+按鈕,添加在上一步中構建好的知識庫。

      注意:當前“圖文並茂回複”與“展示回答來源”功能暫不支援同時開啟。
    3. 實際問答效果:

      image

    方式二(適用智能體應用與工作流程應用)

    1. 上傳圖片至公網可訪問位置,並擷取完整URL。推薦使用OSS,具體操作請參見將圖片上傳至OSS並使用其檔案URL

    2. 插入完整 URL(不支援相對路徑)到檔案中。請注意:不支援在文檔中直接內嵌圖片檔案(例如通過複製粘貼或菜單插入本地圖片)。必須使用公網可訪問的URL連結來引用圖片。

      若已按說明操作,但圖片仍無法顯示,請檢查文本切片中的URL是否完整,確認是否存在多餘空格或特殊字元(可能被系統誤解析),如有問題可直接編輯修正。

      檔案正確引用圖片樣本

      提示詞模板樣本

      實際問答效果

      image

      # 知識庫
      請記住以下材料,他們可能對回答問題有協助。
      ${documents}
      
      # 要求
      如果有圖片,請展示圖片。

      image

      檔案錯誤引用圖片樣本

      提示詞模板樣本

      實際問答效果

      image

      # 知識庫
      請記住以下材料,他們可能對回答問題有協助。
      ${documents}
      
      # 要求
      如果有圖片,請展示圖片。

      image

      解釋:直接插入圖片到檔案中時,阿里雲百鍊應用不會在回答中展示圖片。

    使用圖片問答類知識庫

    1. 上傳圖片至公網可訪問位置,並擷取完整URL。推薦使用OSS,具體操作請參見將圖片上傳至OSS並使用其檔案URL

    2. 表格頁簽中建立一個資料表,並添加一個image_url類型欄位儲存圖片的完整URL。

      說明
      • image_url欄位不支援儲存相對路徑。

      • 單一image_url欄位中不支援儲存多個圖片URL。若單條記錄需關聯多圖,須為每張圖片分別建立獨立的 image_url 欄位(如 image_1image_2 等)。

      • 請確保資料表中每個image_url指向的圖片檔案大小不超過3MB。超過限制將導致知識庫建立失敗。

      • 資料表一旦建立,便無法再新增或修改欄位類型為image_url。請在初次設計表結構時預留所有可能需要的圖片欄位。

      image

    3. 構建知識庫時,選擇圖片問答作為知識庫類型

    4. 在建立/編輯智能體應用時,點擊頁面上圖片(圖片問答類知識庫)右側的+按鈕,添加在上一步中構建好的知識庫。變更提示詞模板為:

      # 知識庫
      請記住以下材料,他們可能對回答問題有協助。
      ${documents}
      
      # 要求
      如果有圖片,請展示圖片。
    5. 接下來,在頁面右側的輸入框中,發起提問。

      例如:“簡單介紹百鍊X1手機。”

      正確引用圖片樣本

      提示詞模板樣本

      使用者提示詞和阿里雲百鍊應用返回的結果

      image

      # 知識庫
      請記住以下材料,他們可能對回答問題有協助。
      ${documents}
      
      # 要求
      如果有圖片,請展示圖片。

      image

許可權與安全

  • Q: 操作知識庫時,遇到報錯“缺少該模組的許可權”,應如何處理?

    RAM使用者預設無法執行建立、更新、刪除知識庫等寫入類操作,需阿里雲帳號(主帳號)為其授予管理員(或至少包含應用資料-操作知識庫-操作頁面許可權

  • Q: 知識庫是否私人?其他組織或使用者能否訪問?

    知識庫僅限其所在業務空間內的成員訪問/操作,不對外公開。

  • Q: 阿里雲是否會使用我帳號下的知識庫回答其他使用者的問題?

    阿里雲嚴格保護資料隱私,絕不會將您的知識庫用於回答其他使用者的問題或模型訓練。資料安全與隱私承諾詳見隱私說明

遷移與匯出

  • Q: 如何匯出知識庫到本地?

    當前不支援一鍵匯出。作為替代方案,您可通過調用ListChunks介面,編寫指令碼批量拉取文檔和切片資料。