すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:辞書構成

最終更新日:Mar 02, 2025

概要

詳細設定の辞書構成を使用すると、テキスト分析用のカスタム辞書を構成できます。組み込みアナライザが検索クエリに対して返す分析結果がビジネス要件を満たせない場合は、適切なアナライザのカスタム辞書を構成して、分析結果に介入できます。このようにして、期待される分析結果を返すことができます。

デフォルトでは、システムは 2 つのバージョンの辞書構成を提供します。 _offline_adv_v1 が名前の末尾に付いているバージョンは、システムによって作成され、8 種類の辞書が含まれています。

辞書の種類

汎用中国語テキストアナライザ.dict

汎用版の中国語 e コマースコンテンツアナライザ.dict

汎用版の中国語ゲームコンテンツアナライザ.dict

中国語教育コンテンツアナライザ.dict

中国語エンターテインメントコンテンツアナライザ.dict

汎用版の英語 e コマースコンテンツアナライザ.dict

中国語 IT コンテンツアナライザ.dict

中国語 e コマースコンテンツアナライザ.dict

_offline_adv_edit が名前の末尾に付いているバージョンは編集可能です。特定の辞書にエントリを追加し、変更を詳細設定に保存してから、[アクション] 列の [公開] をクリックします。システムは、詳細設定で辞書構成の新しいバージョンを自動的に生成します。新しいバージョンの名前には、_offline_adv_v{n} というサフィックスが付きます。ここで、{n} は 2 から始まる整数を示します。詳細設定で辞書構成の新しいバージョンを公開するたびに、新しいバージョンの目的を説明するバージョン記述を指定できます。

カスタム介入エントリの追加

悪いケース: ドキュメント内のフィールドの値が「乒乓球拍卖完了」です。ユーザーが「球拍」を検索すると、フィールドの分析結果は「乒乓 球 拍卖 完了」であるため、ドキュメントを取得できません。検索クエリの用語は、フィールドの分析結果の用語と一致しません。

解決策: この問題を解決するには、次の手順を実行してカスタムエントリ「乒乓球拍」を追加します。

  1. [インスタンスの詳細] ページの左側のナビゲーション ウィンドウで、[構成センター] > [詳細設定] を選択します。表示されるページで、名前に _offline_adv_edit というサフィックスが付いているバージョンを見つけ、[操作] 列の [変更] をクリックします。

  2. フィールド「乒乓球拍」を含むインデックステーブルで使用されている辞書を見つけ、[アクション] 列の [変更] をクリックします。

  3. 次のいずれかの方法を選択して、カスタム介入エントリを追加します。

    1. 表示されるパネルで、次のカスタム介入エントリを入力します: 乒乓球拍。次に、[送信] をクリックします。

    2. 表示されるパネルで、新しい辞書ファイルをアップロードし、フィールドにカスタム介入エントリを入力します。次に、[送信] をクリックします。

      注: ファイルのサイズは 5 MB を超えることはできず、ファイルの形式は .dict または .txt である必要があります

次のいずれかの方法でカスタム介入エントリを追加できます。

1. 介入エントリを分割しない: 1 行に 1 つの介入エントリのみを入力します。エントリは UTF-8 形式でエンコードする必要があり、スペースまたは \t を含めることはできません。例:

开放搜索
opensearch

2. 介入エントリを分割する: 元のエントリと、元エントリの分割後に生成された単語を入力します。単語は UTF-8 形式でエンコードし、\t で分割する必要があります。単語をスペースで区切ります。例:

开放搜索	开放 搜索
opensearch	open search

  1. 編集したバージョンの辞書構成を公開します。

    新しいバージョンの説明を指定します。

    編集したバージョンが公開されると、システムは辞書構成の新しいバージョンを自動的に生成します。

  2. クラスターで辞書構成の新しいバージョンを有効にするには、新しいバージョンをクラスターに同期し、インデックス再作成タスクをトリガーします。

    O&M センターモジュールの [変更履歴] ページの データ ソースの変更 タブで、インデックス再作成タスクの進捗状況を確認できます。

    インデックスが再構築されると、辞書構成はオンラインクエリにすぐに反映されます。

辞書構成のバージョンを削除する

[詳細構成] ページの [辞書構成] タブで、[未使用] 状態の辞書構成のバージョンを削除できます。

[使用中] 状態のバージョンについては、辞書構成を表示することしかできません。このようなバージョンを削除するには、次の手順を実行します。 [インスタンスの詳細] ページの左側のナビゲーションウィンドウで、O&M センター運用管理構成の更新辞書設定バージョン未使用 > を選択します。表示されるページで、 をクリックし、 パラメーターの値を変更します。次に、更新をクラスターに同期し、インデックス再作成タスクをトリガーします。バージョンを削除できるのは、バージョンの状態が に変更された後のみです。

使用上の注意

  • 各インスタンスは、辞書構成の編集可能なバージョンを 1 つだけ持つことができます。

  • [使用中] 状態の辞書構成のバージョンは表示することしかできません。このようなバージョンを削除することはできません。

  • [詳細構成] ページでは、辞書構成とクエリ構成を実行できます。