すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:単一ワーカーインスタンスの概要

最終更新日:Apr 07, 2025

このトピックでは、単一ワーカーを持つ OpenSearch Vector Search Edition インスタンスを購入する方法について説明します。

手順

  1. OpenSearch コンソール にログオンします。左上隅で、OpenSearch Vector Search Edition に切り替えます。インスタンスページで、[インスタンスの作成] をクリックします。

  2. 購入ページで、サービスエディションとして [Vector Search Edition] を選択し、OpenSearch Vector Search Edition インスタンス購入のための以下のパラメーターを構成します。リージョンとゾーン、[Searcher Workers][Searcher Worker Specifications][Total Storage Space of Single Searcher Worker][VPC][vSwitch]。次に、ユーザー名とパスワードを指定し、[今すぐ購入] をクリックします。ユーザー名とパスワードは、クエリでの権限検証に使用されます。Alibaba Cloud アカウントとパスワードをユーザー名とパスワードとして指定しないことをお勧めします。image.png

    説明
    • ビジネス要件に基づいて、購入する Search ワーカーの数と仕様を決定する必要があります。数と仕様を指定すると、価格は自動的に計算され、購入ページ に表示されます。

    • 単一ワーカーインスタンスを購入する場合、Query Result Searcher(QRS)ワーカーを購入する必要はありません。この場合、QRS ワーカーパラメータは 0 のままにし、QRS ワーカーファミリパラメータは無効です。

    • OpenSearch Vector Search Edition インスタンスにアクセスするために使用する Elastic Compute Service(ECS)インスタンスと同じ VPC と vSwitch を指定する必要があります。そうしないと、OpenSearch Vector Search Edition インスタンスにアクセスするときに {'errors':{'code':'403','message':'Forbidden'}} エラーメッセージが報告されます。

    • ローカル SSD を使用する Searcher ワーカーには、50 GB のストレージ容量の無料クォータが提供されます。Searcher ワーカーの追加ストレージ容量を 50 GB 単位で購入できます。クラウドディスクを使用する Searcher ワーカーの場合、ストレージ容量の無料クォータは提供されず、50 GB 単位でストレージ容量を購入できます。

  3. 注文の確認今すぐ有効にする ページで、構成を確認し、利用規約を読み、同意してから、 をクリックします。

  4. インスタンスを購入した後、[コンソール] をクリックします。[インスタンス] ページで、購入したインスタンスを表示できます。

インスタンスの構成

[インスタンス] ページで購入したインスタンスは、[構成保留中] 状態です。システムは、データを含まないインスタンスを自動的にデプロイします。自動的にデプロイされたインスタンスの Searcher ワーカーの数と仕様は、インスタンスの購入時に指定したものと同じです。インスタンスを検索に使用する前に、次の手順を実行します。テーブルの基本情報の構成、データソースの追加、フィールドの構成、インデックススキーマの構成を実行してから、インスタンスのインデックスの再作成を実行します。

1. テーブルの基本情報の構成

インスタンスの詳細ページの左側のナビゲーションウィンドウで、[テーブル管理] をクリックします。[テーブル管理] ページで、[テーブルの追加] をクリックします。作成ウィザードの [テーブルの基本情報] ステップで、テーブルを追加テーブル名データ シャードデータ更新のリソース数シナリオテンプレート、、、 パラメータを構成します。次に、 をクリックします。

image

パラメータ

  • テーブル名:テーブルの名前。カスタムテーブル名を入力できます。

  • データシャード:データシャードの数。単一ワーカーインスタンスの場合、デフォルト値は 1 で、値を変更することはできません。ただし、インスタンスのワーカー数を増やすことができます。詳細については、「インスタンスの構成を変更する」をご参照ください。

  • データ更新のリソース数:データ更新に使用されるリソースの数。デフォルトでは、インデックスごとに 2 つのデータ更新リソースの無料クォータが提供されます。各リソースは、4 つの CPU コアと 8 GB のメモリで構成されています。無料クォータを超えるリソースについては課金されます。詳細については、「OpenSearch Vector Search Edition の課金概要」をご参照ください。

  • シナリオテンプレート:テーブルの作成に使用されるテンプレート。有効な値:共通テンプレート、ベクトル:画像検索、ベクトル:テキストのセマンティック検索。

2. データソースの追加

[データ同期] ステップで、データソースを追加します。次のタイプのデータソースがサポートされています。MaxCompute + APIOSS + APIDLFAPI。この例では、完全データソースとして MaxCompute + API が選択されています。次に、[チェック] をクリックして、データソース情報を確認します。データソース情報がチェックに合格したら、次へ をクリックします。

image

3. フィールドの構成

OpenSearch は、選択したシナリオテンプレートに基づいて関連するプリセットフィールドを提供し、データソースからフィールドリストにすべてのフィールドを自動的にインポートします。

image

次の情報に注意してください

  • プライマリキーフィールドとベクターフィールドは必須です。 プライマリキーフィールドでは、[Type] パラメーターを INT または STRING に設定し、[Primary Key] 列を選択する必要があります。 ベクターフィールドでは、[Type] パラメーターを FLOAT に設定し、[Vector Field] 列を選択する必要があります。

  • デフォルトでは、ベクトルフィールドは FLOAT タイプの複数値フィールドであり、ベクトルフィールドの複数の値はコンマ(,)で区切られます。カスタムの複数値デリミタを入力することもできます。

  • ソースデータにフィールドが存在しないか空の場合、システムは自動的にフィールドをデフォルト値に設定します。デフォルトでは、数値タイプのフィールドは 0 に設定され、STRING タイプのフィールドは空の文字列に設定されます。カスタムデフォルト値を指定することもできます。

4. インデックススキーマの構成

4.1. ベクトルインデックス

image

  • プライマリキーフィールドとベクトルフィールドは必須です。名前空間フィールドはオプションで、空のままにすることができます。

  • [含まれるフィールド] パラメータには、3 つの固定フィールドのみを構成でき、フィールドを追加することはできません。

  • [ベクトル次元]:ベクトルの次元。選択したベクトルモデルに基づいてベクトル次元を指定します。

  • [距離タイプ]:InnerProduct または SquareEuclidean を選択できます。InnerProduct は内積距離を示します。ベクトルスコアが大きいほど、ドキュメントの関連性が高くなります。SquareEuclidean はユークリッド距離の二乗を示します。ベクトルスコアが小さいほど、ドキュメントの関連性が高くなります。

  • [ベクトルインデックスアルゴリズム]:Linear、HNSW、QGraph、QC アルゴリズムがサポートされています。GPU インスタンスも CAGRA アルゴリズムをサポートしています。サポートされているアルゴリズムの詳細については、「ベクトルの紹介」をご参照ください。

  • [リアルタイムインデックス作成]:API 操作を使用してプッシュされた増分データのリアルタイムインデックスを作成するかどうかを指定します。有効な値:true および false。デフォルト値:true。

  • ベクトルインデックスの詳細設定のパラメータを構成することもできます。詳細については、「ベクトルインデックスの共通構成」をご参照ください。

    image

説明

名前空間フィールド:インスタンスのエンジンバージョンが vector service 1.0.2 以前の場合、名前空間フィールドは STRING タイプにすることはできません。

4.2. その他のインデックス

OpenSearch は、ベクトルフィールド以外のフィールドのインデックスを自動的に作成します。インデックス名はフィールド名と同じです。インデックスは [その他] タブで管理できます。ベクトルインデックスは手動で構成する必要があります。

image

4.3. グローバルインデックスの構成

この機能はデフォルトで無効になっています。この機能を有効にすると、整数タイプのフィールドの有効期限を構成できます。期限切れのドキュメントは自動的にクリアされます。

image

5. 作成の確認

確認ステップで、[確認] をクリックします。テーブル管理ページで、テーブルは追加中状態になります。

image.png

6. 変更履歴の表示

インスタンスの詳細ページの左側のナビゲーションウィンドウで、[変更履歴] をクリックします。[変更履歴] ページで、過去 3 日間、7 日間、30 日間のインスタンスの変更履歴を表示できます。たとえば、テーブルの作成、インデックスの作成、インスタンスのスケールアウト、完全データの再インデックス作成のプロセスを表示できます。次の図は、テーブルを作成するプロセスを示しています。[変更履歴] ページのすべてのプロセスが完了すると、検索サービスが構築され、クエリテストを実行できます。

7. クエリテストの実行

インスタンスの詳細ページの左側のナビゲーションウィンドウで、[ベクトル管理] > [クエリテスト] を選択します。フォームモードまたは開発者モードでクエリテストを実行できます。

7.1 フォームモード

右上隅で、[フォームモード] を選択します。次に、[テーブル名] と [クエリタイプ] パラメータを構成します。フォーム モードテーブル名クエリの種類ベクトルテキスト検索検索結果 は、 または に設定できます。この例では、 が選択されています。次に、 フィールドにクエリテキストを入力し、 をクリックします。 セクションでクエリ結果を表示できます。

7.2 開発者モード

右上隅で、開発者モードテーブル名検索 を選択します。 パラメータを構成し、左側のセクションでパラメータを指定してから、 をクリックします。右側のセクションでクエリ結果を表示できます。

  • vector:クエリ対象のベクトル。

  • topK:取得する上位 K 件のドキュメント。

  • includeVector:ドキュメントにベクトル情報を返すかどうかを指定します。

クエリ構文の詳細については、このトピックの「構文」セクションをご参照ください。

構文

SDK を使用してベクトルベースのクエリを実行する

  • SDK を使用してベクトルベースのクエリまたはプライマリキーベースのクエリを実行します。詳細については、「データのクエリ」をご参照ください。

  • SDK を使用してドキュメントを追加または削除します。詳細については、「データの更新」をご参照ください。

インスタンスのスケールアウト

単一ワーカーインスタンスのワーカー数を増やすには、次の手順を実行します。

警告

単一ワーカーインスタンスがスケールアウトされている間、インスタンスは使用できません。スケールアウトの進行状況は、[変更履歴] ページで確認できます。

  1. [インスタンス] ページで、スケールアウトするインスタンスを見つけ、[アクション] 列の [アップグレード/ダウングレード] をクリックします。

  2. [アップグレード/ダウングレード] ページで、購入する QRS ワーカーの数と仕様を指定し、利用規約を読み、同意してから、[今すぐ購入] をクリックします。