このトピックでは、OpenSearch LLMベースの対話型検索エディションインスタンスの詳細について説明します。
インスタンス管理ページで、表示するインスタンスを選択し、操作列の管理をクリックして、インスタンスの基本情報とAPIエンドポイントを表示します。
基本情報
インスタンスの詳細ページのインスタンス情報セクションで、インスタンスID、課金方法、リージョンなどのインスタンスに関する情報を表示できます。
タグパラメータの横にある編集アイコンをクリックして、タグを使用してOpenSearchリソースを分類および管理します。詳細については、タグとはを参照してください。
インスタンスの説明パラメータの横にある編集をクリックして、インスタンスの説明をカスタマイズします。
OpenSearch LLMベースの対話型検索エディションのスタンダードエディションインスタンスは、カスタム大規模言語モデル(LLM)をサポートしていません。このようなインスタンスを購入する際に、GPU仕様とGPUパラメータを設定する必要はありません。したがって、GPU仕様とGPUパラメータの横にはハイフン(-)が表示されます。
APIエンドポイント
APIエンドポイントはエンドポイントとも呼ばれます。APIエンドポイントはリージョンによって異なります。APIまたはSDKを使用してリージョン内のOpenSearchインスタンスにアクセスする場合は、APIエンドポイントセクションに表示されているAPIエンドポイントを使用する必要があります。異なるリージョンでは、シナリオに基づいて内部またはパブリックAPIエンドポイントを使用できます。ビジネス要件に基づいて適切なエンドポイントを選択してください。
シナリオ | 必要なAPIエンドポイント | APIエンドポイントを取得する方法 |
Alibaba Cloud Elastic Compute Service(ECS)インスタンスをデプロイに使用し、内部ネットワーク経由でのアクセスの条件が満たされている場合。 | 内部APIエンドポイント | インスタンス管理ページで、接続するインスタンスを見つけ、操作列の管理をクリックします。インスタンスの詳細ページで、APIエンドポイントを表示します。 |
ECSインスタンスからOpenSearchインスタンスに接続する場合。ただし、ECSインスタンスとOpenSearchインスタンスは内部ネットワーク経由でのアクセスの条件を満たしていません。 | パブリックAPIエンドポイント | |
オンプレミスデバイスからOpenSearchインスタンスに接続する場合 |
内部ネットワーク経由でのアクセスの条件:ECSインスタンスとLLMベースの対話型検索エディションインスタンスが同じリージョンにあり、同じタイプのネットワークを使用していること。ECSインスタンスとLLMベースの対話型検索エディションインスタンスの両方が仮想プライベートクラウド(VPC)にある場合、これらのインスタンスは同じVPCにある必要があります。
LLMベースの対話型検索エディションインスタンスが内部ネットワーク経由でのアクセスの条件を満たしている場合は、内部エンドポイントを使用してインスタンスに接続することをお勧めします。これにより、低レイテンシと高安定性を実現できます。内部エンドポイントを使用する前に、エンドポイントにpingを実行して、エンドポイントにアクセスできるかどうかを確認してください。