AI Search Open Platform の課金方法 - OpenSearch - Alibaba Cloud ドキュメントセンター

このトピックでは、AI Search Open Platform の課金項目、課金方法、および課金ルールについて説明します。

課金項目

AI Search Open Platform では、以下の項目について課金されます。

モデル呼び出し: ドキュメントコンテンツ解析サービス、テキスト埋め込みサービス、ソートサービスなど、モデルの呼び出しに対して課金されます。
モデルのカスタマイズ (中国 (上海) リージョンのみ): ベクトル次元削減サービスのカスタムトレーニングなど、AI 検索オープンプラットフォームが提供するモデルを独自のデータでカスタマイズする場合に課金されます。
モデルのデプロイ (中国 (上海) リージョンのみ): AI 検索オープンプラットフォーム上で異なるソースのモデルをデプロイする際に、デプロイメント料金と呼び出し料金が課金されます。
サービス開発 (中国 (上海) リージョンのみ): AI 検索オープンプラットフォームは PAI Distribution Switch (DSW) 機能を統合しています。プラットフォーム上の Notebook を使用してサービスを開発および実行できます。

説明

AI Search Open Platform は無料で有効化できます。サービスを使用しない場合は課金されません。

課金方法

検索エンジンサービスを除き、AI 検索オープンプラットフォームのすべてのサービスは従量課金制です。料金は、サービス呼び出しの回数と、カスタムモデルトレーニングで消費されたコンピュートユニット (CU) で測定される課金時間に基づいて計算されます。請求書は 1 時間ごとに生成されます。すべての時間単位の請求書は 1 つの注文にまとめられ、合計料金が Alibaba Cloud アカウントから差し引かれます。

重要

2024 年 7 月 4 日 17:00 以降、一部のサービスは段階的価格設定を採用しています。詳細については、以下のセクションの詳細な課金ルールをご参照ください。

課金ルール

モデル呼び出し

大規模言語モデル (LLM) では、トークンはモデルが処理および理解できるテキストの最小単位です。トークンは通常、単語、句、文字、記号などのテキストセグメントを表します。モデルによってチャンク方法は異なり、文字数とトークン数は 1 対 1 で対応しない場合があります。

AI Search Open Platform でのモデル呼び出しで使用されるトークンの課金単位は、USD/1,000 トークンです。一部のサービスは段階的価格設定を採用しており、一部のサービスは入力トークンと出力トークンに基づいて課金されます。

説明

一部のモデルは、トークン計算をサポートしており、呼び出しによって生成されるトークン数を推定できます。

段階的価格設定の例:

ドイツ (フランクフルト) リージョンで、スパーステキスト埋め込みサービスを呼び出して 1,000,000 トークン (1,000 課金単位に相当) を生成した場合、料金は次のように計算されます: 500 × 0.001 + 500 × 0.0004 = 0.7 USD。

入力と出力の課金の例:

ドイツ (フランクフルト) リージョンで、大規模言語モデル qwen3-235b-a22b を呼び出して 1,000 の入力トークンと 1,000 の出力トークンを生成した場合、料金は次のように計算されます:

1 × 0.0007 + 1 × 0.0028 = 0.0035 USD。

ドイツ (フランクフルト) リージョン

モデル名	モデル ID	課金単位	0～500 単位の価格	500 単位を超える価格
ドキュメントコンテンツ解析	ops-document-analyze-001	USD/1,000 トークン	0.0009	0.000272
		USD/画像	0.00073
		USD/表	0.00157
ドキュメントコンテンツ解析 - 意味理解に基づく階層構造の抽出説明ドキュメントコンテンツ解析サービスを呼び出す場合、パラメータを使用して、意味理解に基づくドキュメント階層構造の抽出機能を有効にするかどうかを制御できます。この機能が有効になっている場合、ドキュメント解析料金に加えて、この機能に対して 0.00052 USD/1,000 トークンが課金されます。		USD/1,000 トークン	0.00052
画像テキスト認識	ops-image-analyze-ocr-001	USD/呼び出し	0.012	0.0031
画像コンテンツ理解	ops-image-analyze-vlm-001	USD/1,000 トークン	0.011
ドキュメントチャンキング	ops-document-split-001	USD/1,000 トークン	0.0009	0.000003
テキスト埋め込み	ops-text-embedding-001	USD/1,000 トークン	0.0009	0.000072
	ops-text-embedding-002		0.0009	0.000054
	ops-text-embedding-zh-001		0.0009	0.000022
	ops-text-embedding-en-001		0.0009	0.000019
	ops-gte-sentence-embedding-multilingual-base		0.0009	0.00003
	ops-gte-sentence-embedding-multilingual-base		0.0009	0.00003
	ops-qwen3-embedding- 0.6b		0.0009	0.000062
マルチモーダル埋め込みテキストと画像の埋め込みに使用	ops-m2-encoder テキスト埋め込み	USD/1,000 トークン	0.0009	0.000039
	ops-m2-encoder 画像埋め込み	USD/画像	0.0009	0.000032
	ops-m2-encoder-large テキスト埋め込み	USD/1,000 トークン	0.0009	0.000065
	ops-m2-encoder-large 画像ベクトル化	USD/画像	0.0009	0.000042
	ops-gme-qwen2-vl-2b-instruct テキスト埋め込み	USD/1,000 トークン	0.0009	0.000162
	ops-gme-qwen2-vl-2b-instruct 画像埋め込み	USD/画像	0.0009	0.000146
スパーステキスト埋め込み	ops-text-sparse-embedding-001	USD/1,000 トークン	0.001	0.0004
ベクトル次元削減サービス	ops-embedding-dim-reduction-001	USD/ドキュメント	0.0009	0.0000064
ソートサービス	ops-bge-reranker-larger	USD/ドキュメント	0.0005	0.000048
	ops-text-reranker-001		0.0005	0.00016
	ops-text-reranker-001		0.0005	0.00016
	ops-qwen3-reranker- 0.6b		0.0005	0.000026
ビデオスナップショット	ops-video-snapshot-001	USD/1,000 画像	0.03
音声認識	ops-audio-asr-001	USD/時間	0.2
検索エンジン	Alibaba Cloud Elasticsearch: オープンソースの Elasticsearch をベースに構築された完全マネージド型のクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使用できる従量課金制をサポートしています。詳細については、「Elasticsearch」をご参照ください。
検索エンジン	OpenSearch-Vector Search Edition: 課金の詳細については、「Vector Search Edition」をご参照ください。
LLM	qwen3-235b-a22b	USD/1,000 トークン	入力: 0.0007 出力: 0.0028
	ops-qwen-turbo		入力: 0.000065 出力: 0.00026
	qwen-turbo		入力: 0.00005 出力: 0.0002
	qwen-plus		入力: 0.0004 出力: 0.0012
	qwen-max		入力: 0.0016 出力: 0.0064
クエリ分析	ops-query-analyze-001	USD/1,000 トークン	入力: 0.004 出力: 0.018

中国 (上海) リージョン

モデル名	モデル ID	課金単位	0-500 単位の価格	500 単位を超える価格
ドキュメントコンテンツ解析	ops-document-analyze-001	USD/1,000 トークン	0.0007	0.00085
		USD/イメージ	0.0023
		USD/テーブル	0.005
ドキュメントコンテンツ解析 - 意味理解に基づく階層構造の抽出説明ドキュメントコンテンツ解析サービスを呼び出す際、パラメーターを使用して意味理解に基づくドキュメント階層構造の抽出機能を有効にするかどうかを制御できます。この機能が有効な場合、ドキュメント解析料金に加えて、この機能に対して 0.00031 USD/1,000 トークンが課金されます。		USD/1,000 トークン	0.00031
画像テキスト認識	ops-image-analyze-ocr-001	USD/呼び出し	0.0112	0.0058
画像コンテンツ理解	ops-image-analyze-vlm-001	USD/1,000 トークン	0.0093
ドキュメントチャンキング	ops-document-split-001	USD/1,000 トークン	0.0007	0.000003
テキスト埋め込み	ops-text-embedding-001	USD/1,000 トークン	0.0007	0.000023
	ops-text-embedding-002		0.0007	0.00007
	ops-text-embedding-zh-001		0.0007	0.00001
	ops-text-embedding-en-001		0.0007	0.000011
	ops-gte-sentence-embedding-multilingual-base		0.0007	0.000025
	ops-qwen3-embedding-0.6b		0.0007	0.000071
マルチモーダル埋め込みテキストと画像の埋め込みに使用	ops-m2-encoder テキスト埋め込み	USD/1,000 トークン	0.0007	0.000026
	ops-m2-encoder 画像埋め込み	USD/イメージ	0.0007	0.0000162
	ops-m2-encoder-large テキスト埋め込み	USD/1,000 トークン	0.0007	0.000067
	ops-m2-encoder-large 画像埋め込み	USD/イメージ	0.0007	0.000033
	ops-gme-qwen2-vl-2b-instruct テキスト埋め込み	USD/1,000 トークン	0.0007	0.00008
	ops-gme-qwen2-vl-2b-instruct 画像ベクトル化	USD/イメージ	0.0007	0.000072
スパーステキスト埋め込み	ops-text-sparse-embedding-001	USD/1,000 トークン	0.00084	0.00014
ベクトル次元削減サービス	ops-embedding-dim-reduction-001	USD/ドキュメント	0.0007	0.0000071
ソートサービス	ops-bge-reranker-larger	USD/ドキュメント	0.00014	0.000013
	ops-text-reranker-001		0.00014	0.000062
	ops-qwen3-reranker-0.6b		0.00014	0.000015
ビデオスナップショット	ops-video-snapshot-001	USD/1,000 単位	0.016
音声認識	ops-audio-asr-001	USD/時間	0.09
検索エンジン	Alibaba Cloud Elasticsearch: オープンソースの Elasticsearch をベースに構築された完全マネージド型のクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使用できる従量課金制をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。
検索エンジン	OpenSearch-Vector Search Edition: 課金の詳細については、「Vector Search Edition」をご参照ください。
LLM	qwen3-235b-a22b	USD/1,000 トークン	入力: 0.00056 出力: 0.0056
	qwq-32b		入力: 0.00028 出力: 0.00084
	ops-qwen-turbo		入力: 0.00006 出力: 0.0001
	qwen-turbo		入力: 0.000042 出力: 0.000084
	qwen-plus		入力: 0.000112 出力: 0.00028
	qwen-max		入力: 0.000336 出力: 0.001344
	deepseek-r1		入力: 0.00056 出力: 0.00224
	deepseek-r1-distill-qwen-7b		入力: 0.00007 出力: 0.00014
	deepseek-r1-distill-qwen-14b		入力: 0.00014 出力: 0.00042
	deepseek-v3		入力: 0.00028 出力: 0.00112
Web 検索	Web 検索料金は次のように計算されます: 呼び出し料金 + クエリ再書き込み料金デフォルトでは、Web 検索中のクエリの再書き込みに qwen-max モデルが使用されます。使用方法: Web 検索は次の 2 つの方法で使用できます: Web 検索 API を直接呼び出す。 LLM を使用する際に Web 検索を有効にする。	USD/呼び出し	0.00735
Web 検索		USD/1,000 トークン	クエリの再書き込み: 入力: 0.000336 出力: 0.001344
クエリ分析	ops-query-analyze-001	USD/1,000 トークン	意図認識と代替クエリ拡張: 入力: 0.001 出力: 0.004
クエリ分析	ops-query-analyze-001	USD/1,000 トークン	自然言語から SQL (NL2SQL) への生成: 入力: 0.00031 出力: 0.00078
評価	評価モジュールは、ユーザーが質問をしてから検索拡張生成 (RAG) システムがコンテンツを取得し、LLM が回答を生成するまでの、AI 検索オープンプラットフォームが提供する RAG 開発プロセスを包括的に評価するために使用されます。	USD/1,000 トークン	入力: 0.0007 出力: 0.0021

モデルのカスタマイズ

モデル名

説明

価格

ベクトル次元削減モデルのカスタムトレーニング

ベクトル次元削減モデルのカスタムトレーニングでは、提供されたベクトルデータに基づいてベクトル次元削減モデルをカスタマイズできます。実際のビジネスシナリオでは、まず埋め込みモデルを使用してテキストやクエリをベクトル化し、次にベクトル次元削減モデルを使用してベクトルの次元をさらに削減します。

消費された計算資源の CU 数に基づいて課金されます。各 CU の価格は 0.5422614 USD です。

消費される CU 数は、トレーニングデータの量と次元によって異なります。たとえば、100,000 個の 1024 次元のデータでモデルをトレーニングするには、約 250 CU が消費され、料金は 250 × 0.5422614 = 135.56535 USD となります。

モデルのデプロイ

課金計算式: CU 価格 × インスタンスタイプあたりの CU 数 × インスタンス数

次の表に課金ルールを示します。

インスタンスタイプ	CU 価格 (USD/時間)	マシンあたりの CU 数	マシンあたりの価格 (USD/時間)
gpu.v100.16g.x1	0.15	30.14	4.521
gpu.t4.16g.x1		16.07	2.4105
gpu.a10.24g.x1		11.01	1.6515

たとえば、2 つの gpu.a10.24g.x1 インスタンスを購入してモデルサービスをデプロイする場合、料金は次のように計算されます: 0.15 × 11.01 × 2 = 3.303 USD/時間。

サービス開発

インスタンスを起動すると、従量課金制で課金されます。料金は、次の式を使用して計算されます: CU 価格 × インスタンスタイプあたりの CU 数 × インスタンス数。

次の表に課金ルールを示します。

インスタンスタイプ	CU 価格 (USD/時間)	マシンあたりの CU 数	マシンあたりの価格 (USD/時間)
gpu.t4.16g.x1	0.15	16.07	2.4105
ops.basic1.gi.large	0.15	0.61	0.0915

たとえば、1 つの ops.basic1.gi.large インスタンスを選択した場合、料金は次のように計算されます: 0.15 × 0.61 × 1 = 0.0915 USD/時間。

注意事項

サービス名は、サービス ID および API パラメータと 1 対 1 で対応しています。詳細については、「サービス概要」をご参照ください。
請求書は、実際の使用状況に基づいて 1 時間ごとに生成されます。
段階的価格設定のサービスの場合、料金は各段階の使用状況に基づいて計算されます。
1,000 トークンを課金単位として使用するサービスの場合、使用状況の統計に小数が含まれる場合があります。
サービスの中断を避けるため、Alibaba Cloud アカウントに支払い遅延がないことを確認してください。

課金例

ドイツ (フランクフルト) リージョンで、ドキュメントチャンキングサービスを 1,000 単位で呼び出したとします。料金は次のように計算されます:

最初の 500 単位 (500 を含む) の料金: 0.0009 USD × 500 = 0.45 USD
500 単位を超える料金: 0.000003 USD × 500 = 0.0015 USD
合計料金: 0.45 + 0.0015 = 0.4515 USD

参考資料

課金詳細を表示する