全部產品
Search
文件中心

OpenSearch:富文本功能

更新時間:Mar 13, 2025

本文介紹OpenSearch-LLM智能問答版富文本功能配置與效果。

目前OpenSearch線上的RAG流程中,文檔切片時會提取出所有的富文本元素(圖片,表格,代碼),並以富文字標籤的形式和本文切片同時儲存。開啟富文本產生功能後,大模型在回答時能夠包含召迴文檔中的富常值內容。

開啟富文本功能

問答測試>其他參數中的rich_text_strategy為富文本功能的參數,在應用操作API中,配置該參數則開啟該功能,置空則不開。

image

參數說明:

SearchKnowledge-文本問答介面新增參數:

options.chat.rich_text_strategy

String

富文本LLM輸出後處理方式(如果不存在這個配置或者為空白則不開富文本,預設行為):

  • inside_response: 回答中的tag直接還原到原文裡,Markdown格式(注意表格直接以HTML形式插入markdown)。

  • extend_response: 回答中存在富文本tag,每個tag實際內容單獨在rich_text_ref返回:圖片內容url,表格內容HTML格式,代碼文字格式設定。

inside_response:

回答將以Markdown格式呈現,可能包含富常值內容,如表格、圖片及代碼。

extend_response:

回答仍然為純文字格式,但富文字標籤可被點擊。點擊後將會快顯視窗展示富常值內容(不進行渲染,而是展示原始內容)。

請求樣本

{
	"question": {
		"text": "如何配置敏感性資料識別規則?",
		"type": "TEXT"
	},
	"options": {
		"chat": {
			"rich_text_strategy": "inside_response"
		}
	}
}

extend_response返回樣本

需要對data.rich_text_ref中的富文字標籤進行自主解析,並開發相應邏輯以替換data.answer中的富文字標籤。

{
  "request_id": "0bb16ed4-6eec-4ae4-b1dd-0650289b45b3",
  "status": "OK",
  "latency": 11421.663139,
  "result": {
    "data": [
      {
        "answer": "根據已知資訊,配置敏感性資料識別規則的步驟如下:\n\n1. 進入資料識別規則頁面:\n   - 登入DataWorks控制台,進入資料開發頁面。\n   - 選擇資料治理 > 資料保護傘,進入資料保護傘頁面。\n   - 在左側導覽列選擇規則配置 > 敏感性資料識別,進入資料識別規則頁面。\n\n2. 配置敏感欄位所屬分類:\n   - 如果是新使用者,可以在左側地區搜尋或添加分類。\n   - 如果是老使用者,可以按需建立資料分類。\n   - 注意分類名稱必須唯一,僅支援中英文、數字,長度限制1~30個字元。\n\n3. 配置敏感性資料識別規則:\n   - 在資料識別規則頁面,點擊\"+敏感欄位類型\"新增敏感欄位類型。\n   - 配置敏感欄位類型的基本資料,包括類型、所屬分類、所屬分級和描述資訊。[^表-16134^]\n   - 點擊\"下一步\",進入規則配置頁面。\n   - 在規則配置頁簽,配置敏感欄位識別規則及規則的命中條件,並測試規則準確性。[^圖-19933^]\n   - 發布資料識別規則,點擊\"發布使用\"。\n\n4. 授權並啟動敏感性資料識別任務:\n   - 為敏感性資料識別任務授權,點擊\"開啟任務\"並按照介面指引授權。\n   - 配置敏感性資料識別任務,包括任務類型、掃描方式及範圍。[^圖-41464^]\n   - 點擊\"開啟\",啟動掃描任務。\n\n需要注意的是:\n- 若暫時無需使用規則,可以點擊\"儲存草稿\"。\n- 若某列資料命中多個敏感欄位類型的識別規則,規則的生效順序為:欄位名稱識別 > 資料內容識別 > 欄位注釋識別。\n- 若需要即時觸發新任務,需要手動啟動任務。\n- 識別規則修改後,新規則將在下一次自動任務中啟用。\n\n此外,還可以進行以下管理操作:\n- 複製規則\n- 編輯規則\n- 刪除規則\n- 批量發布規則\n- 批量下架規則\n\n這些操作可以協助使用者更靈活地管理敏感性資料識別規則。",
        "type": "TEXT",
        "reference": [
          {
            "tokenNum": 1814,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
            "url": "https://xxx.com"
          }
        ],
        "rich_text_ref": [
          {
            "id": "表-16134",
            "content": "<table><tbody>\n <tr>\n  <td><b>參數</b></td>\n  <td><b>描述</b></td>\n </tr>\n <tr>\n  <td><b data-tag=\"uicontrol\" id=\"uicontrol-a5j-bxo-9a3\" class=\"uicontrol\">敏感欄位類型</b></td>\n  <td>自訂敏感欄位類型的名稱,例如:姓名、社會安全號碼、手機號等。名稱必須唯一。</td>\n </tr>\n <tr>\n  <td><b data-tag=\"uicontrol\" id=\"uicontrol-80t-1ey-cbs\" class=\"uicontrol\">所屬分類</b></td>\n  <td>選擇敏感欄位類型所屬的分類。若現有分類不滿足需求,請進入<b data-tag=\"uicontrol\" id=\"uicontrol-5sa-eit-jzt\" class=\"uicontrol\">資料分類分級</b>頁面進行設定,詳情請參見<a href=\"https://xxx.dataworks/user-guide/mange-data-sensitivity-levels#concept-ohj-1s3-r2b\" id=\"21566a9cceiv9\" title=\"\" class=\"xref\">配置敏感性資料分類分級</a>。</td>\n </tr>\n <tr>\n  <td><b data-tag=\"uicontrol\" id=\"uicontrol-o8f-oek-vx3\" class=\"uicontrol\">所屬分級</b></td>\n  <td>選擇敏感欄位類型所屬的層級,數字越大,敏感層級越高。若現有分級不滿足需求,請進入<b data-tag=\"uicontrol\" id=\"3a552504f1aui\" class=\"uicontrol\">資料分類分級</b>頁面進行設定,詳情請參見<a href=\"https://help.xxx.dataworks/user-guide/mange-data-sensitivity-levels#concept-ohj-1s3-r2b\" id=\"39588a781b9hn\" title=\"\" class=\"xref\">配置敏感性資料分類分級</a>。</td>\n </tr>\n</tbody></table>"
          },
          {
            "id": "圖-19933",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png"
          },
          {
            "id": "圖-41464",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png"
          }
        ]
      },
      {
        "answer": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p339229.png",
        "type": "IMAGE",
        "reference": [
          {
            "tokenNum": 179,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
            "url": "https://xxx.com"
          }
        ]
      }
    ]
  }
}

inside_response返回樣本

直接解析data.answer欄位為markdown格式即可,無需考慮rich_text_ref欄位。

{
  "request_id": "b1f59cc0-daad-45e2-bc41-f01e1c2ff5d7",
  "status": "OK",
  "latency": 9828.389664,
  "result": {
    "data": [
      {
        "answer": "根據已知資訊,配置敏感性資料識別規則的步驟如下:\n\n1. 進入資料識別規則頁面:\n   - 登入DataWorks控制台,進入資料開發頁面。\n   - 選擇對應工作空間,進入資料開發。\n   - 點擊左側導覽列的\"全部產品 > 資料治理 > 資料保護傘\",進入資料保護傘。\n   - 在左側導覽列選擇\"規則配置 > 敏感性資料識別\",進入資料識別規則頁面。\n\n2. 配置敏感欄位所屬分類:\n   - 如果是新使用者,可以在左側地區搜尋或添加分類。\n   - 如果是老使用者,可以按需建立資料分類。\n   - 注意分類名稱必須唯一,僅支援中英文、數字,長度限制1~30個字元。\n\n3. 配置敏感性資料識別規則:\n   - 在資料識別規則頁面,點擊\"+敏感欄位類型\"新增敏感欄位類型。\n   - 配置敏感欄位類型的基本資料:\n     - 設定敏感欄位類型\n     - 選擇所屬分類\n     - 選擇所屬分級\n     - 輸入描述資訊\n   - 點擊\"下一步\"進入規則配置頁面。\n   - 在規則配置頁簽,配置敏感欄位識別規則及規則的命中條件,並測試規則準確性。![](https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png)\n   - 發布資料識別規則:點擊\"發布使用\"即可發布當前資料識別規則。\n\n4. 授權並啟動敏感性資料識別任務:\n   - 為敏感性資料識別任務授權:點擊敏感性資料識別頁面左上方的\"開啟任務\",按照介面指引授權。\n   - 啟動敏感性資料識別任務:\n     - 配置任務類型、掃描方式及範圍。![](https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png)\n     - 點擊\"開啟\"啟動掃描任務。\n\n5. 管理資料識別規則:\n   - 可以複製、編輯、刪除規則。\n   - 支援批量發布和批量下架規則。\n\n需要注意的是,規則發布後才可使用該規則在識別任務中識別相應敏感性資料。如果規則較多,可以通過批量功能進行發布或下架操作。",
        "type": "TEXT_MARKDOWN",
        "reference": [
          {
            "tokenNum": 1814,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
            "url": "https://xxx.com"
          }
        ],
        "rich_text_ref": [
          {
            "id": "圖-3873",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png"
          },
          {
            "id": "圖-19511",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png"
          }
        ]
      },
      {
        "answer": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p339229.png",
        "type": "IMAGE",
        "reference": [
          {
            "tokenNum": 179,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "如何配置敏感性資料識別規則並執行敏感性資料識別任務_巨量資料開發治理平台 DataWorks(DataWorks)-阿里雲協助中心",
            "url": "https://xxx.com"
          }
        ]
      }
    ]
  }
}

注意

返回的data列表中,"type": "IMAGE"的項為召回階段的部分圖片結果,這裡的圖片與富文本功能無關,無論是否開啟富文本功能,均可擷取這些圖片。富文本功能輸出的圖片相關性比召回階段的圖片更強。