本文介紹OpenSearch-LLM智能問答版富文本功能配置與效果。
目前OpenSearch線上的RAG流程中,文檔切片時會提取出所有的富文本元素(圖片,表格,代碼),並以富文字標籤的形式和本文切片同時儲存。開啟富文本產生功能後,大模型在回答時能夠包含召迴文檔中的富常值內容。
開啟富文本功能
在問答測試>其他參數中的rich_text_strategy為富文本功能的參數,在應用操作API中,配置該參數則開啟該功能,置空則不開。

參數說明:
SearchKnowledge-文本問答介面新增參數:
options.chat.rich_text_strategy | String | 否 | 富文本LLM輸出後處理方式(如果不存在這個配置或者為空白則不開富文本,預設行為):
|
inside_response:
回答將以Markdown格式呈現,可能包含富常值內容,如表格、圖片及代碼。
extend_response:
回答仍然為純文字格式,但富文字標籤可被點擊。點擊後將會快顯視窗展示富常值內容(不進行渲染,而是展示原始內容)。
請求樣本
{
"question": {
"text": "如何配置敏感性資料識別規則?",
"type": "TEXT"
},
"options": {
"chat": {
"rich_text_strategy": "inside_response"
}
}
}extend_response返回樣本
需要對data.rich_text_ref中的富文字標籤進行自主解析,並開發相應邏輯以替換data.answer中的富文字標籤。
{
"request_id": "0bb16ed4-6eec-4ae4-b1dd-0650289b45b3",
"status": "OK",
"latency": 11421.663139,
"result": {
"data": [
{
"answer": "根據已知資訊,配置敏感性資料識別規則的步驟如下:\n\n1. 進入資料識別規則頁面:\n - 登入DataWorks控制台,進入資料開發頁面。\n - 選擇資料治理 > 資料保護傘,進入資料保護傘頁面。\n - 在左側導覽列選擇規則配置 > 敏感性資料識別,進入資料識別規則頁面。\n\n2. 配置敏感欄位所屬分類:\n - 如果是新使用者,可以在左側地區搜尋或添加分類。\n - 如果是老使用者,可以按需建立資料分類。\n - 注意分類名稱必須唯一,僅支援中英文、數字,長度限制1~30個字元。\n\n3. 配置敏感性資料識別規則:\n - 在資料識別規則頁面,點擊\"+敏感欄位類型\"新增敏感欄位類型。\n - 配置敏感欄位類型的基本資料,包括類型、所屬分類、所屬分級和描述資訊。[^表-16134^]\n - 點擊\"下一步\",進入規則配置頁面。\n - 在規則配置頁簽,配置敏感欄位識別規則及規則的命中條件,並測試規則準確性。[^圖-19933^]\n - 發布資料識別規則,點擊\"發布使用\"。\n\n4. 授權並啟動敏感性資料識別任務:\n - 為敏感性資料識別任務授權,點擊\"開啟任務\"並按照介面指引授權。\n - 配置敏感性資料識別任務,包括任務類型、掃描方式及範圍。[^圖-41464^]\n - 點擊\"開啟\",啟動掃描任務。\n\n需要注意的是:\n- 若暫時無需使用規則,可以點擊\"儲存草稿\"。\n- 若某列資料命中多個敏感欄位類型的識別規則,規則的生效順序為:欄位名稱識別 > 資料內容識別 > 欄位注釋識別。\n- 若需要即時觸發新任務,需要手動啟動任務。\n- 識別規則修改後,新規則將在下一次自動任務中啟用。\n\n此外,還可以進行以下管理操作:\n- 複製規則\n- 編輯規則\n- 刪除規則\n- 批量發布規則\n- 批量下架規則\n\n這些操作可以協助使用者更靈活地管理敏感性資料識別規則。",
"type": "TEXT",
"reference": [
{
"tokenNum": 1814,
"id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
"title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
"url": "https://xxx.com"
}
],
"rich_text_ref": [
{
"id": "表-16134",
"content": "<table><tbody>\n <tr>\n <td><b>參數</b></td>\n <td><b>描述</b></td>\n </tr>\n <tr>\n <td><b data-tag=\"uicontrol\" id=\"uicontrol-a5j-bxo-9a3\" class=\"uicontrol\">敏感欄位類型</b></td>\n <td>自訂敏感欄位類型的名稱,例如:姓名、社會安全號碼、手機號等。名稱必須唯一。</td>\n </tr>\n <tr>\n <td><b data-tag=\"uicontrol\" id=\"uicontrol-80t-1ey-cbs\" class=\"uicontrol\">所屬分類</b></td>\n <td>選擇敏感欄位類型所屬的分類。若現有分類不滿足需求,請進入<b data-tag=\"uicontrol\" id=\"uicontrol-5sa-eit-jzt\" class=\"uicontrol\">資料分類分級</b>頁面進行設定,詳情請參見<a href=\"https://xxx.dataworks/user-guide/mange-data-sensitivity-levels#concept-ohj-1s3-r2b\" id=\"21566a9cceiv9\" title=\"\" class=\"xref\">配置敏感性資料分類分級</a>。</td>\n </tr>\n <tr>\n <td><b data-tag=\"uicontrol\" id=\"uicontrol-o8f-oek-vx3\" class=\"uicontrol\">所屬分級</b></td>\n <td>選擇敏感欄位類型所屬的層級,數字越大,敏感層級越高。若現有分級不滿足需求,請進入<b data-tag=\"uicontrol\" id=\"3a552504f1aui\" class=\"uicontrol\">資料分類分級</b>頁面進行設定,詳情請參見<a href=\"https://help.xxx.dataworks/user-guide/mange-data-sensitivity-levels#concept-ohj-1s3-r2b\" id=\"39588a781b9hn\" title=\"\" class=\"xref\">配置敏感性資料分類分級</a>。</td>\n </tr>\n</tbody></table>"
},
{
"id": "圖-19933",
"content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png"
},
{
"id": "圖-41464",
"content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png"
}
]
},
{
"answer": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p339229.png",
"type": "IMAGE",
"reference": [
{
"tokenNum": 179,
"id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
"title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
"url": "https://xxx.com"
}
]
}
]
}
}inside_response返回樣本
直接解析data.answer欄位為markdown格式即可,無需考慮rich_text_ref欄位。
{
"request_id": "b1f59cc0-daad-45e2-bc41-f01e1c2ff5d7",
"status": "OK",
"latency": 9828.389664,
"result": {
"data": [
{
"answer": "根據已知資訊,配置敏感性資料識別規則的步驟如下:\n\n1. 進入資料識別規則頁面:\n - 登入DataWorks控制台,進入資料開發頁面。\n - 選擇對應工作空間,進入資料開發。\n - 點擊左側導覽列的\"全部產品 > 資料治理 > 資料保護傘\",進入資料保護傘。\n - 在左側導覽列選擇\"規則配置 > 敏感性資料識別\",進入資料識別規則頁面。\n\n2. 配置敏感欄位所屬分類:\n - 如果是新使用者,可以在左側地區搜尋或添加分類。\n - 如果是老使用者,可以按需建立資料分類。\n - 注意分類名稱必須唯一,僅支援中英文、數字,長度限制1~30個字元。\n\n3. 配置敏感性資料識別規則:\n - 在資料識別規則頁面,點擊\"+敏感欄位類型\"新增敏感欄位類型。\n - 配置敏感欄位類型的基本資料:\n - 設定敏感欄位類型\n - 選擇所屬分類\n - 選擇所屬分級\n - 輸入描述資訊\n - 點擊\"下一步\"進入規則配置頁面。\n - 在規則配置頁簽,配置敏感欄位識別規則及規則的命中條件,並測試規則準確性。\n - 發布資料識別規則:點擊\"發布使用\"即可發布當前資料識別規則。\n\n4. 授權並啟動敏感性資料識別任務:\n - 為敏感性資料識別任務授權:點擊敏感性資料識別頁面左上方的\"開啟任務\",按照介面指引授權。\n - 啟動敏感性資料識別任務:\n - 配置任務類型、掃描方式及範圍。\n - 點擊\"開啟\"啟動掃描任務。\n\n5. 管理資料識別規則:\n - 可以複製、編輯、刪除規則。\n - 支援批量發布和批量下架規則。\n\n需要注意的是,規則發布後才可使用該規則在識別任務中識別相應敏感性資料。如果規則較多,可以通過批量功能進行發布或下架操作。",
"type": "TEXT_MARKDOWN",
"reference": [
{
"tokenNum": 1814,
"id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
"title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
"url": "https://xxx.com"
}
],
"rich_text_ref": [
{
"id": "圖-3873",
"content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png"
},
{
"id": "圖-19511",
"content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png"
}
]
},
{
"answer": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p339229.png",
"type": "IMAGE",
"reference": [
{
"tokenNum": 179,
"id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
"title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
"url": "https://xxx.com"
}
]
}
]
}
}注意
返回的data列表中,"type": "IMAGE"的項為召回階段的部分圖片結果,這裡的圖片與富文本功能無關,無論是否開啟富文本功能,均可擷取這些圖片。富文本功能輸出的圖片相關性比召回階段的圖片更強。