全部產品
Search
文件中心

OpenSearch:問答參數說明

更新時間:Jul 04, 2025

本文對OpenSearch-LLM智能問答版的自訂進行參數說明和文法說明。

問答參數

參數說明

參數

類型

必需

取值範圍

預設值

描述

模型選擇

String

-

opensearch-qwen

表示該次搜尋使用的LLM大模型。可選擇的模型請參考:LLM管理

Prompt

String

-

系統預設範本

表示該次搜尋使用的Prompt。可選擇的Prompt請參考:Prompt管理

多輪對話

Boolean

-

true

  • false:表示多輪對話關閉;

  • true:表示多輪對話開啟,將結合近n輪對話內容返回結果;

  • session:用於標識對話來源,相同的對話來源會根據上下文進行對話。

流式輸出

Boolean

-

true

  • false:表示流式輸出關閉;

  • true:表示流式輸出開啟,將即時輸出模型回答結果。

Prompt參數

參數說明

參數

類型

必需

取值範圍

預設值

描述

attitude

String

-

normal

  • 對話內容的語氣,預設為normal

  • normal:無

  • polite:使用和藹和禮貌的語氣

  • patience:使用委婉和耐心的語氣

rule

String

-

detailed

對話內容的詳細程度,預設為detailed

  • detailed:詳細和專業

  • stepbystep:詳細且按步驟

noanswer

String

-

sorry

無法回答問題時的回複,預設為sorry

  • sorry:抱歉,根據已知資訊無法回答該問題

  • uncertain:我不知道

language

String

-

Chinese

回答問題使用的語言,預設為Chinese

  • Chinese:中文

  • English:英語

  • Thai:泰語

  • Korean:韓語

role

Boolean

-

true

開啟後,將定製回答的角色。

role_name

String

-

AI小助手

定製回答的角色,例如:AI小助手

out_format

String

-

text

輸出內容的形式,預設為text

  • text:文本

  • table:表格

  • list:列項

  • markdown:markdown

文檔召回參數

參數說明

參數

類型

必需

取值範圍

預設值

描述

filter

String

-

-

召迴文檔時根據目標欄位進行過濾。例:filter = field = value

top_n

Int

(0, 50]

5

召回的文檔數。

sf

Float

[0,+∞)

1.3

控制向量召回的向量分的閾值。

  • 當沒有開啟稀疏向量時,取值範圍為[0, 2.0],預設值是1.3,該值越小,結果越相關,但結果數會越少;反之,可能會召回不太相關的結果。

  • 當開啟了稀疏向量時,預設值是0.35。其值越大,召回的結果越相關,結果數會越少;反之,結果可能會不太相關。

dense_weight

Float

(0,1)

0.7

選擇稀疏向量模型時可選,表示稠密向量的權重,取值(0,1) 的浮點數,稀疏向量的權重則為 1 - dense_weight。

formula

String

-

向量相似性

文檔召回的排序公式。

operator

String

-

AND

文本召回時,文本token之間的關係。

文法說明

參數

文法說明

filter

過濾條件式格式設定為:field=value

樣本:

  1. 只從category為value1的doc中擷取資料

    "filter" : "category=\"value1\""

  2. 只從category為value1和value2的doc中擷取資料

    "filter" : "category=\"value1\" OR category=\"value2\""

  3. category多值過濾

    category欄位的多值傳參的時候,每個item需要用英文逗號隔開
    eg:category =  類別1,類別2,類別3,類別4
    "filter" : "category=\"類別1\""  //category對應的value可以是傳入多值的任意item

top_n

top_n:value eg: top_n = 3 可根據實際需要調節top_n參數大小

sf

sf=value eg:sf = 1.3 當沒有開啟稀疏向量時,取值範圍為[0, 2.0],預設值是1.3,該值越小,結果越相關,但結果數會越少;反之,可能會召回不太相關的結果。當開啟了稀疏向量時,預設值是0.35。其值越大,召回的結果越相關,結果數會越少;反之,結果可能會不太相關。

formula

  • 文本相關性

  1. text_relevance: 關鍵詞在欄位上的文本匹配度

  2. field_match_ratio: 擷取某欄位上與查詢詞匹配的分詞片語個數與該欄位總片語個數的比值

  3. query_match_ratio:擷取查詢詞中(在某個欄位上)命中片語個數與總片語個數的比值

  4. fieldterm_proximity: 用來表示關鍵詞分詞片語在欄位上的緊密程度

  5. field_length:擷取某個欄位上的分詞片語個數

  6. query_term_count: 返回查詢詞分詞後片語個數

  7. query_term_match_count:擷取查詢詞中(在某個欄位上)命中文檔的片語個數

  8. field_term_match_count:擷取文檔中某個欄位與查詢詞匹配的片語個數

  9. query_min_slide_window:查詢詞在某個欄位上命中的分詞片語個數與該片語在欄位上最小視窗的比值

  • 時效性

  1. timeliness: 時效分,用于衡量文檔的新舊程度,單位為秒

  2. timeliness_ms: 時效分,用于衡量文檔的新舊程度,單位為毫秒

  • 功能性

  1. tag_match: 用於對查詢語句和文檔做標籤匹配,使用匹配結果對文檔進行算分加權

  2. first_phase_score: 擷取粗排運算式最終計算分值

  3. kvpairs_value: 擷取查詢串中kvpairs子句中指定欄位的值

  4. normalize:歸一化函數,根據不同的算分將數值歸一化至[0, 1]

  5. in和notin: 判斷欄位值是否(不)在指定列表中

參考圖片參數

參數說明

參數

類型

必需

取值範圍

預設值

描述

sf

Float

[0,+∞)

1

參考圖片的閾值,對於稀疏向量模型sf越大則參考圖片與內容的向量相似性越大,對於稠密向量模型sf越大則參考圖片與內容的向量相似性越小。

dense_weight

Float

(0,1)

0.7

選擇稀疏向量模型時可選,表示稠密向量的權重,取值(0,1) 的浮點數,稀疏向量的權重則為 1 - dense_weight。

文法說明

參數

文法說明

sf

sf=value eg:sf = 1 可根據預期調節sf參數的值,需要區分是否為稀疏向量模型

Query理解參數

參數說明

參數

類型

必需

取值範圍

預設值

描述

query_extend

Boolean

-

false

開啟後會擴充Query,提升召回品質

query_exten_num

Int

(0,+∞)

5

擴充Query的數量

人工幹預參數

人工幹預參數說明

參數

類型

必需

取值範圍

預設值

描述

sf

Float

[0,2]

0.3

人工幹預問題的閾值,預設為0.3,sf越大則越容易匹配到人工幹預詞條

文法說明

參數

文法說明

sf

sf=value eg:sf = 0.3 可根據預期調節sf參數的值,sf越大則越容易匹配到人工幹預詞條

其它參數

其它參數說明

參數

類型

必需

取值範圍

預設值

描述

return_hits

Boolean

-

false

是否在結果中返迴文檔召回的結果,如果不返回就只有參考連結。

csi_level

String

-

strict

綠網配置

  • none: 表示不需要經過綠網處理

  • loose: 內容需要經過綠網處理,且只有綠網判斷確定存在敏感內容,就會被攔截,返回無結果

  • strict: 內容需要經過綠網處理,且一旦綠網判斷確定或者疑似存在敏感內容,就會被攔截,返回無結果

history_max

INT

(0,20]

20

多輪對話歷史最大輪數,最大20輪

link

Boolean

-

false

是否在結果中返迴文檔召回的具體來源

rich_text_strategy

String

-

富文本LLM輸出後處理方式(如果不存在這個配置或者為空白則不開富文本,預設行為):

  • inside_response: 回答中的tag直接還原到原文裡,markdown格式(注意表格直接以html形式插入markdown)。

  • extend_response: 回答中存在富文本tag,每個tag實際內容單獨在rich_text_ref返回:圖片內容url,表格內容html格式,代碼文字格式設定。

文法說明

參數

文法說明

return_hits

return_hits:false eg:return_hits = true 返回對應的搜尋結果

link

包含內容的返回資訊執行個體如下:

可以通過線上擴容和離線擴容兩種方式擴容ECS雲端硬碟容量[^1^]。線上擴容無需重啟執行個體,離線擴容需要重啟執行個體[^1^]。具體操作步驟為:在ECS控制台上選擇待擴容的雲端硬碟,在操作列選擇擴容,然後根據需要選擇擴容方式[^1^]。如果需要擴容分區和檔案系統,可以通過命令列擷取或者通過控制台擷取[^2^]。擴容雲端硬碟容量後,新容量生效後無法再縮小,建議合理規劃儲存空間[^3^]。
說明

其中被'[^' 和 '^]' 包括起來的數字表示引用結果中reference裡的第幾個文檔。例如'[^1^]'表示應用reference中的第一個文檔。