全部產品
Search
文件中心

OpenSearch:停用詞

更新時間:Jul 13, 2024

功能介紹

根據系統內建的停用詞典過濾查詢中無意義的詞(一般是使用頻度過高的但不影響查詢結果的詞,比如標點符號、語氣助詞等)。例如:查詢詞“奔跑吧!兄弟”,經過停用詞處理後標點符號“!”不參與召回;或者“你吃飯了嗎”,經過停用詞處理後語氣助詞“嗎”不參與召回。

功能使用流程

1.OpenSearch控制台選擇左側導覽列中的“召回配置”下方對應的“查詢分析配置”,選擇對應的應用程式名稱和應用類型(線上/線下)點擊建立

image

2.輸入“規則名稱”,選擇“索引範圍”,選擇“行業類型”,功能選擇選中“停用詞”,點擊“確定”image

:如果未設定幹預詞典,則以預設詞典為準。如果實際使用情境中出現badcase ,可以參考下文配置幹預詞典。

3.規則建立完畢後,可以點擊“搜尋測試”進行搜尋效果測試:

image測試效果:image

查看查詢分析過程:image

4.調試無誤後,在查詢分析介面,切換到“索引視角”,將對應的自訂查詢分析設定為預設查詢分析

image

5.設定預設自訂查詢分析後的介面效果:

image

停用詞幹預詞典

業務情境不一樣,停用詞也會有所差異,會存在系統內建詞典缺少停用詞或者提供了錯誤的停用詞。因此,提供了幹預功能,供使用者自訂停用詞。通過建立停用詞幹預詞典,並在查詢分析中停用詞配置相應的幹預詞典,就可以幹預停用詞功能。具體停用詞幹預詞典配置,請點擊此處