すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:カスタム取得アナライザ

最終更新日:Apr 01, 2026

標準搭載のアナライザは一般的なテキストには有効ですが、E コマースのプロダクト名やゲーム用語、教育分野の Q&A などドメイン固有のコンテンツでは、アナライザがご利用の語彙を理解できないため、検索結果が不十分になることがよくあります。OpenSearch Industry Algorithm Edition を使用すると、ご自身のアプリケーションデータに基づいてカスタムテキストアナライザをトレーニングし、このギャップを解消できます。システムは既存のデータを自動的に抽出し、その語彙とパターンを学習して、ご利用のドメインに最適化された取得モデルを生成します。トレーニングが完了したら、そのモデルをカスタムアナライザにバインドし、インデックスに適用します。

カスタマイズされた取得モデルは、ストレージ容量、コンピューティングリソース、およびモデルトレーニングに基づいて課金されます。詳細については、「課金概要」をご参照ください。

仕組み

カスタマイズされた取得モデルのトレーニングおよびデプロイには、以下の 3 つのステップがあります。

  1. モデルの作成とトレーニング — モデルパラメーターを設定してトレーニングを開始します。システムは対象アプリケーションから自動的にデータを抽出するため、手動でのデータインポートは不要です。

  2. カスタムアナライザの作成 — トレーニング済みのモデルをテキストアナライザにラップすることで、インデックスに適用できるようにします。

  3. カスタムアナライザの構成 — オフライン変更を通じてアナライザをインデックスフィールドに適用し、その後インデックスを再構築します。

制限事項

制限事項詳細
インスタンスの種類Industry Algorithm Edition - 専用クラスター インスタンスでのみ利用可能です。
インスタンスあたりのモデル数最大 5 件のカスタマイズされた取得モデルを作成できます。
適用範囲モデルは特定のアプリケーションに紐付いており、アプリケーション間で共有することはできません。
アナライザの種類テキストアナライザのみカスタマイズ可能です。

前提条件

作業を開始する前に、以下を準備してください。

  • Industry Algorithm Edition - 専用クラスター インスタンス

モデルの作成とトレーニング

  1. 左側のナビゲーションウィンドウで、検索アルゴリズムセンター > 取得構成 を選択します。左側のペインで、カスタマイズ取得モデル をクリックします。

  2. モデルを作成する専用アプリケーションを選択し、[作成] をクリックします。

    image

  3. 以下のパラメーターを設定し、[送信] をクリックします。

    パラメーター説明
    モデル名モデルの名前です。モデル作成後は変更できません。
    モデルタイプカスタマイズ取得モデルのタイプです。
    基本アナライザ起点となる業界別アナライザです。「基本アナライザのオプション」をご参照ください。
    トレーニングフィールドモデルのトレーニングに使用するフィールドです。SHORT TEXT および TEXT データの型のフィールドのみサポートされています。
    正規化(オプション)クエリ時にのみ適用されるテキスト正規化です。保存済みフィールドの内容には影響しません。「正規化オプション」をご参照ください。

    image

  4. モデルが作成されると、デフォルトで 利用不可 状態になります。カスタマイズ取得モデルページで、[操作] 列の [トレーニング] をクリックします。

    説明

    トレーニングには通常 1~2 営業日かかります。モデルは複数回再トレーニングできます。各トレーニングの完了時に、[トレーニング履歴] セクションに新しいバージョンが追加され、バージョン番号が 1 ずつ増分されます。

    image

基本アナライザのオプション

[基本アナライザ] ドロップダウンリストから、以下のいずれかの組み込み業界別アナライザを選択します。

  • 中国語 - 汎用アナライザ

  • 中国語 - E コマースアナライザ

  • IT - コンテンツアナライザ

  • 業界向け - ゲーム用汎用アナライザ

  • 業界向け - 教育 Q&A 検索用アナライザ

  • 業界向け - IT コンテンツ分析

  • 業界向け - E コマース用汎用アナライザ

正規化オプション

[正規化] パラメーターはクエリ時のみ変換を適用し、保存済みフィールドの内容は変更しません。以下のオプションを 1 つ以上選択してください。

オプション効果
大文字から小文字への変換マッチング前にクエリ用語を小文字に変換します。
繁体字から簡体字への変換クエリ内の繁体字を簡体字に変換します。
全角文字から半角文字への変換クエリ内の全角英数字を正規化します。

カスタムアナライザの作成

モデルのトレーニングが完了し、利用可能 状態になったら、そのモデルをラップするカスタムアナライザを作成します。

  1. 左側のナビゲーションウィンドウで、検索アルゴリズムセンター > 取得構成 を選択します。左側のペインで、アナライザ管理 をクリックします。

  2. [テキストアナライザ] タブで、[作成] をクリックします。

    image

  3. 表示されたパネルで、名前を入力し、アナライザタイプを Tailored Model Analyzer に設定します。HA3 エンジンインスタンスを選択し、作成したカスタマイズ取得モデルを選択して、[保存] をクリックします。

    image

  4. 保存後、アナライザをテストして、形態素解析が期待通りの結果を出力することを確認します。また、アナライザのエントリを管理することもできます。

    image

カスタムアナライザの構成

カスタムアナライザをオフライン変更を通じてインデックスフィールドに適用します。

  1. 左側のナビゲーションウィンドウで、インスタンス管理 > HA3 エンジン を選択します。ご利用のアプリケーションを見つけ、[操作] 列の [詳細] をクリックします。詳細ページで、[オフラインアプリケーションの変更] をクリックします。

    image

  2. インデックススキーマ ステップで、対象のインデックスを見つけます。[分析方法] 列で、構成済みのカスタムアナライザを選択し、使用するモデルバージョンを選択します。

    image

  3. オフライン変更を完了し、インデックスの再構築が完了するまで待ちます。

    image

  4. インデックスの再構築後、検索テスト ページでカスタマイズ取得モデルをテストします。

カスタマイズ取得モデルの管理

カスタマイズ取得モデルページ

image

カスタマイズ取得モデルページには、モデル名、モデルタイプ、モデルのステータス、最新トレーニングの開始時刻、最新バージョンのステータスなどの情報が一覧表示されます。モデルのステータスは 利用可能 または 利用不可 のいずれかです。

[操作] 列から以下の操作が実行できます。

操作説明
詳細モデル詳細ページを表示します。
トレーニング / 再トレーニング新しいトレーニングを開始します。最新バージョンが トレーニング中 の場合は、[再トレーニング] ボタンは使用できません。
削除モデルを削除します。インデックスから参照されているモデルは削除できません。

モデル詳細ページ

モデル詳細ページには以下の 3 つのセクションがあります。

セクション内容編集可能
基本情報作成時刻、モデルステータス、最新トレーニングの開始時刻、最新バージョンのステータスいいえ
構成情報モデル作成時に指定した基本アナライザ、トレーニングフィールド、正規化設定いいえ
トレーニング履歴バージョン番号、構成、ステータス、トレーニングの開始・終了時刻、およびモデルを参照しているインデックス。このセクションから、典型的なケースでモデルの効果をテストし、バージョン間の結果を比較してダウンロードできます。
image

次のステップ