このトピックでは、単一ワーカーを持つ OpenSearch Vector Search Edition インスタンスを購入する方法について説明します。
手順
OpenSearch コンソール にログオンします。左上隅で、OpenSearch Vector Search Edition に切り替えます。インスタンスページで、[インスタンスの作成] をクリックします。
購入ページで、サービスエディションとして [Vector Search Edition] を選択し、OpenSearch Vector Search Edition インスタンス購入のための以下のパラメーターを構成します。リージョンとゾーン、[Searcher Workers]、[Searcher Worker Specifications]、[Total Storage Space of Single Searcher Worker]、[VPC]、[vSwitch]。次に、ユーザー名とパスワードを指定し、[今すぐ購入] をクリックします。ユーザー名とパスワードは、クエリでの権限検証に使用されます。Alibaba Cloud アカウントとパスワードをユーザー名とパスワードとして指定しないことをお勧めします。
説明ビジネス要件に基づいて、購入する Search ワーカーの数と仕様を決定する必要があります。数と仕様を指定すると、価格は自動的に計算され、購入ページ に表示されます。
単一ワーカーインスタンスを購入する場合、Query Result Searcher(QRS)ワーカーを購入する必要はありません。この場合、QRS ワーカーパラメータは 0 のままにし、QRS ワーカーファミリパラメータは無効です。
OpenSearch Vector Search Edition インスタンスにアクセスするために使用する Elastic Compute Service(ECS)インスタンスと同じ VPC と vSwitch を指定する必要があります。そうしないと、OpenSearch Vector Search Edition インスタンスにアクセスするときに {'errors':{'code':'403','message':'Forbidden'}} エラーメッセージが報告されます。
ローカル SSD を使用する Searcher ワーカーには、50 GB のストレージ容量の無料クォータが提供されます。Searcher ワーカーの追加ストレージ容量を 50 GB 単位で購入できます。クラウドディスクを使用する Searcher ワーカーの場合、ストレージ容量の無料クォータは提供されず、50 GB 単位でストレージ容量を購入できます。
注文の確認今すぐ有効にする ページで、構成を確認し、利用規約を読み、同意してから、 をクリックします。
インスタンスを購入した後、[コンソール] をクリックします。[インスタンス] ページで、購入したインスタンスを表示できます。
インスタンスの構成
[インスタンス] ページで購入したインスタンスは、[構成保留中] 状態です。システムは、データを含まないインスタンスを自動的にデプロイします。自動的にデプロイされたインスタンスの Searcher ワーカーの数と仕様は、インスタンスの購入時に指定したものと同じです。インスタンスを検索に使用する前に、次の手順を実行します。テーブルの基本情報の構成、データソースの追加、フィールドの構成、インデックススキーマの構成を実行してから、インスタンスのインデックスの再作成を実行します。
1. テーブルの基本情報の構成
インスタンスの詳細ページの左側のナビゲーションウィンドウで、[テーブル管理] をクリックします。[テーブル管理] ページで、[テーブルの追加] をクリックします。作成ウィザードの [テーブルの基本情報] ステップで、テーブルを追加テーブル名データ シャードデータ更新のリソース数シナリオテンプレート、、、 パラメータを構成します。次に、 をクリックします。

パラメータ:
テーブル名:テーブルの名前。カスタムテーブル名を入力できます。
データシャード:データシャードの数。単一ワーカーインスタンスの場合、デフォルト値は 1 で、値を変更することはできません。ただし、インスタンスのワーカー数を増やすことができます。詳細については、「インスタンスの構成を変更する」をご参照ください。
データ更新のリソース数:データ更新に使用されるリソースの数。デフォルトでは、インデックスごとに 2 つのデータ更新リソースの無料クォータが提供されます。各リソースは、4 つの CPU コアと 8 GB のメモリで構成されています。無料クォータを超えるリソースについては課金されます。詳細については、「OpenSearch Vector Search Edition の課金概要」をご参照ください。
シナリオテンプレート:テーブルの作成に使用されるテンプレート。有効な値:共通テンプレート、ベクトル:画像検索、ベクトル:テキストのセマンティック検索。
2. データソースの追加
[データ同期] ステップで、データソースを追加します。次のタイプのデータソースがサポートされています。MaxCompute + API、OSS + API、DLF、API。この例では、完全データソースとして MaxCompute + API が選択されています。次に、[チェック] をクリックして、データソース情報を確認します。データソース情報がチェックに合格したら、次へ をクリックします。

3. フィールドの構成
OpenSearch は、選択したシナリオテンプレートに基づいて関連するプリセットフィールドを提供し、データソースからフィールドリストにすべてのフィールドを自動的にインポートします。

次の情報に注意してください:
プライマリキーフィールドとベクターフィールドは必須です。 プライマリキーフィールドでは、[Type] パラメーターを INT または STRING に設定し、[Primary Key] 列を選択する必要があります。 ベクターフィールドでは、[Type] パラメーターを FLOAT に設定し、[Vector Field] 列を選択する必要があります。
デフォルトでは、ベクトルフィールドは FLOAT タイプの複数値フィールドであり、ベクトルフィールドの複数の値はコンマ(,)で区切られます。カスタムの複数値デリミタを入力することもできます。
ソースデータにフィールドが存在しないか空の場合、システムは自動的にフィールドをデフォルト値に設定します。デフォルトでは、数値タイプのフィールドは 0 に設定され、STRING タイプのフィールドは空の文字列に設定されます。カスタムデフォルト値を指定することもできます。
4. インデックススキーマの構成
4.1. ベクトルインデックス

プライマリキーフィールドとベクトルフィールドは必須です。名前空間フィールドはオプションで、空のままにすることができます。
[含まれるフィールド] パラメータには、3 つの固定フィールドのみを構成でき、フィールドを追加することはできません。
[ベクトル次元]:ベクトルの次元。選択したベクトルモデルに基づいてベクトル次元を指定します。
[距離タイプ]:InnerProduct または SquareEuclidean を選択できます。InnerProduct は内積距離を示します。ベクトルスコアが大きいほど、ドキュメントの関連性が高くなります。SquareEuclidean はユークリッド距離の二乗を示します。ベクトルスコアが小さいほど、ドキュメントの関連性が高くなります。
[ベクトルインデックスアルゴリズム]:Linear、HNSW、QGraph、QC アルゴリズムがサポートされています。GPU インスタンスも CAGRA アルゴリズムをサポートしています。サポートされているアルゴリズムの詳細については、「ベクトルの紹介」をご参照ください。
[リアルタイムインデックス作成]:API 操作を使用してプッシュされた増分データのリアルタイムインデックスを作成するかどうかを指定します。有効な値:true および false。デフォルト値:true。
ベクトルインデックスの詳細設定のパラメータを構成することもできます。詳細については、「ベクトルインデックスの共通構成」をご参照ください。

名前空間フィールド:インスタンスのエンジンバージョンが vector service 1.0.2 以前の場合、名前空間フィールドは STRING タイプにすることはできません。
4.2. その他のインデックス
OpenSearch は、ベクトルフィールド以外のフィールドのインデックスを自動的に作成します。インデックス名はフィールド名と同じです。インデックスは [その他] タブで管理できます。ベクトルインデックスは手動で構成する必要があります。

4.3. グローバルインデックスの構成
この機能はデフォルトで無効になっています。この機能を有効にすると、整数タイプのフィールドの有効期限を構成できます。期限切れのドキュメントは自動的にクリアされます。

5. 作成の確認
確認ステップで、[確認] をクリックします。テーブル管理ページで、テーブルは追加中状態になります。

6. 変更履歴の表示
インスタンスの詳細ページの左側のナビゲーションウィンドウで、[変更履歴] をクリックします。[変更履歴] ページで、過去 3 日間、7 日間、30 日間のインスタンスの変更履歴を表示できます。たとえば、テーブルの作成、インデックスの作成、インスタンスのスケールアウト、完全データの再インデックス作成のプロセスを表示できます。次の図は、テーブルを作成するプロセスを示しています。[変更履歴] ページのすべてのプロセスが完了すると、検索サービスが構築され、クエリテストを実行できます。
7. クエリテストの実行
インスタンスの詳細ページの左側のナビゲーションウィンドウで、[ベクトル管理] > [クエリテスト] を選択します。フォームモードまたは開発者モードでクエリテストを実行できます。
7.1 フォームモード
右上隅で、[フォームモード] を選択します。次に、[テーブル名] と [クエリタイプ] パラメータを構成します。フォーム モードテーブル名クエリの種類ベクトルテキスト検索検索結果 は、 または に設定できます。この例では、 が選択されています。次に、 フィールドにクエリテキストを入力し、 をクリックします。 セクションでクエリ結果を表示できます。
7.2 開発者モード
右上隅で、開発者モードテーブル名検索 を選択します。 パラメータを構成し、左側のセクションでパラメータを指定してから、 をクリックします。右側のセクションでクエリ結果を表示できます。
vector:クエリ対象のベクトル。
topK:取得する上位 K 件のドキュメント。
includeVector:ドキュメントにベクトル情報を返すかどうかを指定します。
クエリ構文の詳細については、このトピックの「構文」セクションをご参照ください。
構文
ベクトルベースのクエリの構文:ベクトルベースのクエリ
プライマリキーベースのクエリの構文:プライマリキーベースのクエリ
フィルター式の構文:フィルター式
SDK を使用してベクトルベースのクエリを実行する
SDK を使用してベクトルベースのクエリまたはプライマリキーベースのクエリを実行します。詳細については、「データのクエリ」をご参照ください。
SDK を使用してドキュメントを追加または削除します。詳細については、「データの更新」をご参照ください。
インスタンスのスケールアウト
単一ワーカーインスタンスのワーカー数を増やすには、次の手順を実行します。
単一ワーカーインスタンスがスケールアウトされている間、インスタンスは使用できません。スケールアウトの進行状況は、[変更履歴] ページで確認できます。
[インスタンス] ページで、スケールアウトするインスタンスを見つけ、[アクション] 列の [アップグレード/ダウングレード] をクリックします。
[アップグレード/ダウングレード] ページで、購入する QRS ワーカーの数と仕様を指定し、利用規約を読み、同意してから、[今すぐ購入] をクリックします。