LLM ベース会話検索の課金概要 - OpenSearch

このトピックでは、OpenSearch LLM ベースの会話型検索エディションの課金について概要を説明します。

課金方法

課金方法	説明
従量課金制	従量課金制では、最初にリソースを使用し、後で料金を支払います。システムは1時間ごとに請求書を生成し、1時間ごとの請求書に基づいてAlibaba Cloudアカウントの残高から料金を差し引きます。すべての時間ごとの請求書は、合計請求書に属します。

課金対象項目	単位	利用可能な範囲	ステップ	説明
ストレージリソース	GB	1～100	1 GB	固定ストレージ料金が請求されます。ストレージ料金は、OpenSearch LLM ベースの会話型検索エディションインスタンスの購入時に選択したストレージクォータによって異なります。
コンピューティングリソース	CU	0～3600	該当なし	1時間あたりに使用したコンピューティングリソースの量に基づいて課金されます。リクエスト数と1秒あたりのクエリ数（QPS）が多いほど、消費するコンピューティングリソースが多くなります。

Region	Unit price (USD per GB per hour)	Example
Singapore	0.030	OpenSearch LLM ベースの会話型検索エディションインスタンスを購入し、10 GB のストレージクォータで構成した場合、1時間あたりのストレージ料金は、次の式に基づいて計算されます。 10 GB × 0.03 USD/GB/時間 = 0.3 USD。

Region	Unit price (USD per CU per hour)	Example
Singapore	0.086	インスタンス A が午前 11 時から 12 時の間に 100 コンピューティングユニット（CU）のコンピューティングリソースを会話型検索に使用した場合、1 時間以内のコンピューティングリソース料金は、次の式に基づいて計算されます。 100 CU × 0.086 USD/CU/時間 = 8.6 USD。

重要

コンピューティングリソース料金は、コンソールおよび API リクエストで消費するコンピューティングリソースの実際の使用量によって異なります。
平均して、1 CU のコンピューティングリソースを使用して、会話型検索の API リクエストを 10 回開始できます。コンピューティングリソースの実際の使用量は、会話の複雑さによって異なります。
各インスタンスは、会話型検索で最大 10 QPS をサポートします。インスタンスの QPS が制限を超えた場合、サービスレベルアグリーメント（SLA）は保証されません。QPS 制限を引き上げるには、事前に申請してください。

ユーザー A は OpenSearch LLM ベースの会話型検索エディションインスタンスを購入し、2 GB のストレージクォータで構成します。

午前 6 時から 7 時の間、ユーザー A は会話型検索の API リクエストを開始せず、コンピューティングリソースは消費されません。

1 時間以内の合計料金は、次の式に基づいて計算されます。 2 GB × 0.03 USD/GB/時間 = 0.06 USD。

午前 7 時から 8 時の間、ユーザー A は会話型検索の API リクエストを 100 回開始し、10 CU のコンピューティングリソースが消費されます。

1 時間以内の合計料金は、次の式に基づいて計算されます。 2 GB × 0.03 USD/GB/時間 + 10 CU × 0.086 USD/CU/時間 = 0.92 USD。

午前 8 時から 9 時の間、ユーザー A は会話型検索の API リクエストを 1,000 回開始し、100 CU のコンピューティングリソースが消費されます。

1 時間以内の合計料金は、次の式に基づいて計算されます。 2 GB × 0.03 USD/GB/時間 + 100 CU × 0.086 USD/CU/時間 = 8.66 USD。