OpenSearch-行業演算法版提供了文本分析器、向量分析器和文本-自訂分析器三種分析器。
分詞是搜尋引擎中一個基礎但重要的組件,分詞的結果直接影響搜尋效果。由於業務情境的多樣,同一個短語在不同的業務、不同的語境下,其語義可能會不一樣,期望分詞的結果也不一樣。為此,OpenSearch除了提供面向通用領域的基礎分析器外,還提供了面向特定領域的分析器,如面向電商領域的電商分析器等。具體詳情請參見文本分析器。
向量分析器可以將複雜的資料轉化為易於計算和分析的向量形式,並在此基礎上提供高效的相似性計算、特徵提取和語義理解能力。行業演算法版內建了多維度、面向特定行業以及部分來自AI搜尋開放平台的向量分析器,具體詳情請參見向量分析器。
為了更好地滿足使用者的業務需求,OpenSearch可以讓使用者在系統提供的基礎分析器的基礎上,通過結合幹預詞條的形式建立自訂分析器。在應用的索引欄位的分析器中選擇使用相應的分析器,以達到幹預索引和查詢時分詞結果,確保搜尋結果的品質。具體詳情請參見文本-自訂分析器。