標準搭載のアナライザは一般的なテキストには有効ですが、E コマースのプロダクト名やゲーム用語、教育分野の Q&A などドメイン固有のコンテンツでは、アナライザがご利用の語彙を理解できないため、検索結果が不十分になることがよくあります。OpenSearch Industry Algorithm Edition を使用すると、ご自身のアプリケーションデータに基づいてカスタムテキストアナライザをトレーニングし、このギャップを解消できます。システムは既存のデータを自動的に抽出し、その語彙とパターンを学習して、ご利用のドメインに最適化された取得モデルを生成します。トレーニングが完了したら、そのモデルをカスタムアナライザにバインドし、インデックスに適用します。
カスタマイズされた取得モデルは、ストレージ容量、コンピューティングリソース、およびモデルトレーニングに基づいて課金されます。詳細については、「課金概要」をご参照ください。
仕組み
カスタマイズされた取得モデルのトレーニングおよびデプロイには、以下の 3 つのステップがあります。
モデルの作成とトレーニング — モデルパラメーターを設定してトレーニングを開始します。システムは対象アプリケーションから自動的にデータを抽出するため、手動でのデータインポートは不要です。
カスタムアナライザの作成 — トレーニング済みのモデルをテキストアナライザにラップすることで、インデックスに適用できるようにします。
カスタムアナライザの構成 — オフライン変更を通じてアナライザをインデックスフィールドに適用し、その後インデックスを再構築します。
制限事項
| 制限事項 | 詳細 |
|---|---|
| インスタンスの種類 | Industry Algorithm Edition - 専用クラスター インスタンスでのみ利用可能です。 |
| インスタンスあたりのモデル数 | 最大 5 件のカスタマイズされた取得モデルを作成できます。 |
| 適用範囲 | モデルは特定のアプリケーションに紐付いており、アプリケーション間で共有することはできません。 |
| アナライザの種類 | テキストアナライザのみカスタマイズ可能です。 |
前提条件
作業を開始する前に、以下を準備してください。
Industry Algorithm Edition - 専用クラスター インスタンス
モデルの作成とトレーニング
左側のナビゲーションウィンドウで、検索アルゴリズムセンター > 取得構成 を選択します。左側のペインで、カスタマイズ取得モデル をクリックします。
モデルを作成する専用アプリケーションを選択し、[作成] をクリックします。

以下のパラメーターを設定し、[送信] をクリックします。
パラメーター 説明 モデル名 モデルの名前です。モデル作成後は変更できません。 モデルタイプ カスタマイズ取得モデルのタイプです。 基本アナライザ 起点となる業界別アナライザです。「基本アナライザのオプション」をご参照ください。 トレーニングフィールド モデルのトレーニングに使用するフィールドです。SHORT TEXT および TEXT データの型のフィールドのみサポートされています。 正規化 (オプション)クエリ時にのみ適用されるテキスト正規化です。保存済みフィールドの内容には影響しません。「正規化オプション」をご参照ください。 
モデルが作成されると、デフォルトで 利用不可 状態になります。カスタマイズ取得モデルページで、[操作] 列の [トレーニング] をクリックします。
説明トレーニングには通常 1~2 営業日かかります。モデルは複数回再トレーニングできます。各トレーニングの完了時に、[トレーニング履歴] セクションに新しいバージョンが追加され、バージョン番号が 1 ずつ増分されます。

基本アナライザのオプション
[基本アナライザ] ドロップダウンリストから、以下のいずれかの組み込み業界別アナライザを選択します。
中国語 - 汎用アナライザ
中国語 - E コマースアナライザ
IT - コンテンツアナライザ
業界向け - ゲーム用汎用アナライザ
業界向け - 教育 Q&A 検索用アナライザ
業界向け - IT コンテンツ分析
業界向け - E コマース用汎用アナライザ
正規化オプション
[正規化] パラメーターはクエリ時のみ変換を適用し、保存済みフィールドの内容は変更しません。以下のオプションを 1 つ以上選択してください。
| オプション | 効果 |
|---|---|
| 大文字から小文字への変換 | マッチング前にクエリ用語を小文字に変換します。 |
| 繁体字から簡体字への変換 | クエリ内の繁体字を簡体字に変換します。 |
| 全角文字から半角文字への変換 | クエリ内の全角英数字を正規化します。 |
カスタムアナライザの作成
モデルのトレーニングが完了し、利用可能 状態になったら、そのモデルをラップするカスタムアナライザを作成します。
左側のナビゲーションウィンドウで、検索アルゴリズムセンター > 取得構成 を選択します。左側のペインで、アナライザ管理 をクリックします。
[テキストアナライザ] タブで、[作成] をクリックします。

表示されたパネルで、名前を入力し、アナライザタイプを Tailored Model Analyzer に設定します。HA3 エンジンインスタンスを選択し、作成したカスタマイズ取得モデルを選択して、[保存] をクリックします。

保存後、アナライザをテストして、形態素解析が期待通りの結果を出力することを確認します。また、アナライザのエントリを管理することもできます。

カスタムアナライザの構成
カスタムアナライザをオフライン変更を通じてインデックスフィールドに適用します。
左側のナビゲーションウィンドウで、インスタンス管理 > HA3 エンジン を選択します。ご利用のアプリケーションを見つけ、[操作] 列の [詳細] をクリックします。詳細ページで、[オフラインアプリケーションの変更] をクリックします。

インデックススキーマ ステップで、対象のインデックスを見つけます。[分析方法] 列で、構成済みのカスタムアナライザを選択し、使用するモデルバージョンを選択します。

オフライン変更を完了し、インデックスの再構築が完了するまで待ちます。

インデックスの再構築後、検索テスト ページでカスタマイズ取得モデルをテストします。
カスタマイズ取得モデルの管理
カスタマイズ取得モデルページ

カスタマイズ取得モデルページには、モデル名、モデルタイプ、モデルのステータス、最新トレーニングの開始時刻、最新バージョンのステータスなどの情報が一覧表示されます。モデルのステータスは 利用可能 または 利用不可 のいずれかです。
[操作] 列から以下の操作が実行できます。
| 操作 | 説明 |
|---|---|
| 詳細 | モデル詳細ページを表示します。 |
| トレーニング / 再トレーニング | 新しいトレーニングを開始します。最新バージョンが トレーニング中 の場合は、[再トレーニング] ボタンは使用できません。 |
| 削除 | モデルを削除します。インデックスから参照されているモデルは削除できません。 |
モデル詳細ページ
モデル詳細ページには以下の 3 つのセクションがあります。
| セクション | 内容 | 編集可能 |
|---|---|---|
| 基本情報 | 作成時刻、モデルステータス、最新トレーニングの開始時刻、最新バージョンのステータス | いいえ |
| 構成情報 | モデル作成時に指定した基本アナライザ、トレーニングフィールド、正規化設定 | いいえ |
| トレーニング履歴 | バージョン番号、構成、ステータス、トレーニングの開始・終了時刻、およびモデルを参照しているインデックス。このセクションから、典型的なケースでモデルの効果をテストし、バージョン間の結果を比較してダウンロードできます。 | — |

次のステップ
カスタムテキストアナライザ — エントリを管理し、カスタムアナライザを微調整します。
検索テストの実行 — アナライザをインデックスに適用した後の取得品質を検証します。
課金概要 — カスタマイズ取得モデルの課金方法について確認します。