全部產品
Search
文件中心

OpenSearch:同義字

更新時間:Jul 13, 2024

功能介紹

在實際搜尋情境中,會經常出現包含同義字的表達。例如,我們希望使用者在搜尋廣東話的同時,也能找出和粵語有關的資訊;使用者在搜尋蘋果手機的同時,包含iPhone的內容也能被檢索並呈現。在現實生活中,相同語義的表述詞彙往往有很多,而使用者在檢索的時候很難在一條 query 中將它們全部體現,所以識別和提供同義字檢索顯然可以獲得更高的召回率。同義字功能主要是對查詢詞進行同義擴充,擴大召回和查詢詞同義的文檔。例:“包菜” 存在一個同義字是“圓白菜”,在沒有開啟同義字功能時,搜尋“包菜”時是無法召迴文檔中僅包含“圓白菜”;開啟同義字功能時,則能召回。

功能使用流程

1.OpenSearch控制台選擇左側導覽列中的“召回配置”下方對應的“查詢分析配置”,選擇對應的應用程式名稱和應用類型(線上/線下)點擊建立

image

2.輸入“規則名稱”,選擇“索引範圍”,選擇“行業類型”,功能選擇選中“同義字”,點擊“確定”image

:如果未設定幹預詞典,則按照系統預設的同義字詞典。如果實際使用情境中出現badcase ,可以參考下文配置幹預詞典。

3.規則建立完畢後,可以進行搜尋效果測試:

image測試效果:image查看查詢分析過程:image

4.調試無誤後,在查詢分析介面,切換到“索引視角”,將對應的自訂查詢分析設定為預設查詢分析

image

5.設定預設自訂查詢分析後的介面效果:

image

同義字幹預詞典

業務情境不一樣,某些詞的同義字也會有所差異,會存在系統內建詞典缺少同義字或者提供了錯誤的同義字。因此,提供了幹預功能,供使用者自訂同義字。通過建立同義字幹預詞典,並在查詢分析中同義字配置相應的幹預詞典,就可以幹預同義字功能。具體同義字幹預詞典配置及原理,請點擊此處