概要
検索クエリを使用してドキュメントを取得する前に、OpenSearch は検索クエリのセマンティクスを分析および処理します。OpenSearch の同義語設定機能は、検索クエリの同義語に基づいてドキュメントを取得します。これにより、取得されるドキュメントの数が増加します。ビジネスシナリオは業界によって異なります。最適な検索パフォーマンスを実現するには、アプリケーションに固有の同義語設定モデルを使用する必要があります。
OpenSearch は、幅広いドメイン固有の同義語設定モデルを提供します。対応する業界固有のアナライザーに基づいて、カスタムの同義語設定モデルを設定および学習できます。同義語設定モデルを学習すると、システムはアプリケーションの既存のデータを自動的に抽出し、アプリケーションのビジネスロジックに基づいてデータを分析します。パーソナライズされた同義語をインポートして、モデルを学習および最適化することもできます。詳細については、テクニカルサポートにお問い合わせください。
調整された取得モデルは、ストレージ容量、コンピューティングリソース、およびモデル学習に基づいて課金されます。課金ルールの詳細については、用語 を参照してください。
調整された取得モデルの作成と使用
同義語設定モデルを作成および使用するには、次の手順を実行します。
同義語設定モデルを作成および学習します。
クエリ分析ルールを設定し、学習済み同義語設定モデルを参照します。
必要に応じて、介入辞書を使用して同義語設定モデルを調整します。
モデルの作成と学習
OpenSearch コンソール にログインします。左側のナビゲーションペインで、OpenSearch 業界アルゴリズム版 > 検索アルゴリズムセンター > 取得設定 を選択します。取得設定ページで、左側のペインの 調整された取得モデル をクリックします。表示されるページで、アプリケーションを選択し、作成 をクリックします。

モデル名 および 学習フィールド パラメーターを設定します。モデルタイプ ドロップダウンリストから 同義語モデル を選択します。次に、送信 をクリックします。

モデルの作成後、モデル名は変更できません。
学習フィールドパラメーターには、SHORT TEXT または TEXT データ型のフィールドのみを指定できます。
同義語設定モデルが作成されます。調整された取得モデルページに戻ります。

作成されたモデルを見つけ、そのステータスを確認します。モデルステータス 列には 利用不可 が表示され、最新バージョンのステータス 列には 学習待ち が表示されます。アクション 列の 学習 をクリックします。

モデルの学習には数時間かかり、時間はデータ量によって異なります。
モデルを繰り返し学習できます。モデル学習が完了するたびに、モデルの詳細ページの学習履歴セクションにモデルバージョンが追加されます。バージョン番号は 1 ずつ増加します。
同義語設定モデルが学習されたら、そのステータスを確認します。モデルステータス 列には 利用可能 が表示され、最新バージョンのステータス 列には 学習済み が表示されます。

クエリ分析ルールの設定
クエリ分析ルールを設定する場合は、同義語 を選択し、辞書 パラメーターにカスタムモデルタイプを選択してから、カスタム同義語モデル ドロップダウンリストから作成したモデルを選択します。次に、カスタム同義語モデルバージョン ドロップダウンリストから最新バージョンを選択し、必要に応じて介入辞書を選択して、OK をクリックします。
クエリ分析ルールがない場合は、最初に クエリ分析ルール を作成します。
介入辞書の作成方法と、同義語設定の介入エントリの追加方法の詳細については、同義語設定の介入辞書 を参照してください。
詳細ページ
調整された取得モデルページ
調整された取得モデルページ

調整された取得モデルページには、モデル名、モデルタイプ、モデルステータス、最終学習開始日時、最新バージョンのステータス、アクション などの列に各モデルの情報が表示されます。
クエリ分析ルールによって参照されている調整された取得モデルは削除できません。
同義語設定モデルの詳細ページ
同義語設定モデルの詳細ページは、基本情報、設定情報、学習履歴 の 3 つのセクションで構成されています。
1. 同義語設定モデルが学習されたら、モデルを見つけて、アクション 列の 詳細 をクリックします。次に、学習履歴セクションで、参照ルール列の 表示 をクリックして、モデルを参照するクエリ分析ルールを表示します。


2. モデルをテストします。


3. 典型的なケースで同義語設定モデルのパフォーマンスを比較します。


組み込みモデルと現在のモデルの異なるバージョンを選択して、同義語設定モデルのパフォーマンスを比較できます。
典型的なケース比較セクションには、選択した両方の同義語設定モデルのテキストと結果を含む、最大 200 件の同義語設定結果が表示されます。
テストテキストフィールドに検索クエリを入力して、同義語設定結果を取得できます。
検索テストページ
OpenSearch コンソール の左側のナビゲーションペインで、OpenSearch 業界アルゴリズム版 > 機能拡張 > 検索テスト を選択します。

各検索クエリで消費されるコンピューティングリソースの量を表示するには、カスタムパラメーター fetch=result:compute_cost を追加し、ソースコードモード をオンにします。

インデックス検索に複数のモデルを使用する場合は、OR で区切ります。

制限事項
この機能は、業界アルゴリズム版 の専用アプリケーションでのみ使用できます。
1 つのアプリケーションにつき、最大 5 つの調整された取得モデルを作成できます。1 つのモデルは最大 3 つのバージョンを持つことができます。
調整された取得モデルは特定のアプリケーション用に作成され、アプリケーション間で設定することはできません。