このトピックでは、AI Search Open Platform の課金項目、課金方法、および課金ルールについて説明します。
課金項目
AI Search Open Platform では、以下の項目について課金されます。
モデル呼び出し: ドキュメントコンテンツ解析サービス、テキスト埋め込みサービス、ソートサービスなど、モデルの呼び出しに対して課金されます。
モデルのカスタマイズ (中国 (上海) リージョンのみ): ベクトル次元削減サービスのカスタムトレーニングなど、AI 検索オープンプラットフォームが提供するモデルを独自のデータでカスタマイズする場合に課金されます。
モデルのデプロイ (中国 (上海) リージョンのみ): AI 検索オープンプラットフォーム上で異なるソースのモデルをデプロイする際に、デプロイメント料金と呼び出し料金が課金されます。
サービス開発 (中国 (上海) リージョンのみ): AI 検索オープンプラットフォームは PAI Distribution Switch (DSW) 機能を統合しています。プラットフォーム上の Notebook を使用してサービスを開発および実行できます。
AI Search Open Platform は無料で有効化できます。サービスを使用しない場合は課金されません。
課金方法
検索エンジンサービスを除き、AI 検索オープンプラットフォームのすべてのサービスは従量課金制です。料金は、サービス呼び出しの回数と、カスタムモデルトレーニングで消費されたコンピュートユニット (CU) で測定される課金時間に基づいて計算されます。請求書は 1 時間ごとに生成されます。すべての時間単位の請求書は 1 つの注文にまとめられ、合計料金が Alibaba Cloud アカウントから差し引かれます。
2024 年 7 月 4 日 17:00 以降、一部のサービスは段階的価格設定を採用しています。詳細については、以下のセクションの詳細な課金ルールをご参照ください。
課金ルール
モデル呼び出し
大規模言語モデル (LLM) では、トークンはモデルが処理および理解できるテキストの最小単位です。トークンは通常、単語、句、文字、記号などのテキストセグメントを表します。モデルによってチャンク方法は異なり、文字数とトークン数は 1 対 1 で対応しない場合があります。
AI Search Open Platform でのモデル呼び出しで使用されるトークンの課金単位は、USD/1,000 トークンです。一部のサービスは段階的価格設定を採用しており、一部のサービスは入力トークンと出力トークンに基づいて課金されます。
一部のモデルは、トークン計算 をサポートしており、呼び出しによって生成されるトークン数を推定できます。
段階的価格設定の例:
ドイツ (フランクフルト) リージョンで、スパーステキスト埋め込みサービスを呼び出して 1,000,000 トークン (1,000 課金単位に相当) を生成した場合、料金は次のように計算されます: 500 × 0.001 + 500 × 0.0004 = 0.7 USD。
入力と出力の課金の例:
ドイツ (フランクフルト) リージョンで、大規模言語モデル qwen3-235b-a22b を呼び出して 1,000 の入力トークンと 1,000 の出力トークンを生成した場合、料金は次のように計算されます:
1 × 0.0007 + 1 × 0.0028 = 0.0035 USD。
ドイツ (フランクフルト) リージョン
モデル名 | モデル ID | 課金単位 | 0~500 単位の価格 | 500 単位を超える価格 |
ops-document-analyze-001 | USD/1,000 トークン | 0.0009 | 0.000272 | |
USD/画像 | 0.00073 | |||
USD/表 | 0.00157 | |||
ドキュメントコンテンツ解析 - 意味理解に基づく階層構造の抽出 説明 ドキュメントコンテンツ解析サービスを呼び出す場合、パラメータを使用して、意味理解に基づくドキュメント階層構造の抽出機能を有効にするかどうかを制御できます。この機能が有効になっている場合、ドキュメント解析料金に加えて、この機能に対して 0.00052 USD/1,000 トークンが課金されます。 | USD/1,000 トークン | 0.00052 | ||
ops-image-analyze-ocr-001 | USD/呼び出し | 0.012 | 0.0031 | |
ops-image-analyze-vlm-001 | USD/1,000 トークン | 0.011 | ||
ops-document-split-001 | USD/1,000 トークン | 0.0009 | 0.000003 | |
ops-text-embedding-001 | USD/1,000 トークン | 0.0009 | 0.000072 | |
ops-text-embedding-002 | 0.0009 | 0.000054 | ||
ops-text-embedding-zh-001 | 0.0009 | 0.000022 | ||
ops-text-embedding-en-001 | 0.0009 | 0.000019 | ||
ops-gte-sentence-embedding-multilingual-base | 0.0009 | 0.00003 | ||
ops-qwen3-embedding- 0.6b | 0.0009 | 0.000062 | ||
テキストと画像の埋め込みに使用 | ops-m2-encoder テキスト埋め込み | USD/1,000 トークン | 0.0009 | 0.000039 |
ops-m2-encoder 画像埋め込み | USD/画像 | 0.0009 | 0.000032 | |
ops-m2-encoder-large テキスト埋め込み | USD/1,000 トークン | 0.0009 | 0.000065 | |
ops-m2-encoder-large 画像ベクトル化 | USD/画像 | 0.0009 | 0.000042 | |
ops-gme-qwen2-vl-2b-instruct テキスト埋め込み | USD/1,000 トークン | 0.0009 | 0.000162 | |
ops-gme-qwen2-vl-2b-instruct 画像埋め込み | USD/画像 | 0.0009 | 0.000146 | |
ops-text-sparse-embedding-001 | USD/1,000 トークン | 0.001 | 0.0004 | |
ops-embedding-dim-reduction-001 | USD/ドキュメント | 0.0009 | 0.0000064 | |
ops-bge-reranker-larger | USD/ドキュメント | 0.0005 | 0.000048 | |
ops-text-reranker-001 | 0.0005 | 0.00016 | ||
ops-qwen3-reranker- 0.6b | 0.0005 | 0.000026 | ||
ops-video-snapshot-001 | USD/1,000 画像 | 0.03 | ||
ops-audio-asr-001 | USD/時間 | 0.2 | ||
検索エンジン | Alibaba Cloud Elasticsearch: オープンソースの Elasticsearch をベースに構築された完全マネージド型のクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使用できる従量課金制をサポートしています。詳細については、「Elasticsearch」をご参照ください。 | |||
OpenSearch-Vector Search Edition: 課金の詳細については、「Vector Search Edition」をご参照ください。 | ||||
qwen3-235b-a22b | USD/1,000 トークン | 入力: 0.0007 出力: 0.0028 | ||
ops-qwen-turbo | 入力: 0.000065 出力: 0.00026 | |||
qwen-turbo | 入力: 0.00005 出力: 0.0002 | |||
qwen-plus | 入力: 0.0004 出力: 0.0012 | |||
qwen-max | 入力: 0.0016 出力: 0.0064 | |||
ops-query-analyze-001 | USD/1,000 トークン | 入力: 0.004 出力: 0.018 | ||
中国 (上海) リージョン
モデル名 | モデル ID | 課金単位 | 0-500 単位の価格 | 500 単位を超える価格 |
ops-document-analyze-001 | USD/1,000 トークン | 0.0007 | 0.00085 | |
USD/イメージ | 0.0023 | |||
USD/テーブル | 0.005 | |||
ドキュメントコンテンツ解析 - 意味理解に基づく階層構造の抽出 説明 ドキュメントコンテンツ解析サービスを呼び出す際、パラメーターを使用して意味理解に基づくドキュメント階層構造の抽出機能を有効にするかどうかを制御できます。この機能が有効な場合、ドキュメント解析料金に加えて、この機能に対して 0.00031 USD/1,000 トークンが課金されます。 | USD/1,000 トークン | 0.00031 | ||
ops-image-analyze-ocr-001 | USD/呼び出し | 0.0112 | 0.0058 | |
ops-image-analyze-vlm-001 | USD/1,000 トークン | 0.0093 | ||
ops-document-split-001 | USD/1,000 トークン | 0.0007 | 0.000003 | |
ops-text-embedding-001 | USD/1,000 トークン | 0.0007 | 0.000023 | |
ops-text-embedding-002 | 0.0007 | 0.00007 | ||
ops-text-embedding-zh-001 | 0.0007 | 0.00001 | ||
ops-text-embedding-en-001 | 0.0007 | 0.000011 | ||
ops-gte-sentence-embedding-multilingual-base | 0.0007 | 0.000025 | ||
ops-qwen3-embedding-0.6b | 0.0007 | 0.000071 | ||
テキストと画像の埋め込みに使用 | ops-m2-encoder テキスト埋め込み | USD/1,000 トークン | 0.0007 | 0.000026 |
ops-m2-encoder 画像埋め込み | USD/イメージ | 0.0007 | 0.0000162 | |
ops-m2-encoder-large テキスト埋め込み | USD/1,000 トークン | 0.0007 | 0.000067 | |
ops-m2-encoder-large 画像埋め込み | USD/イメージ | 0.0007 | 0.000033 | |
ops-gme-qwen2-vl-2b-instruct テキスト埋め込み | USD/1,000 トークン | 0.0007 | 0.00008 | |
ops-gme-qwen2-vl-2b-instruct 画像ベクトル化 | USD/イメージ | 0.0007 | 0.000072 | |
ops-text-sparse-embedding-001 | USD/1,000 トークン | 0.00084 | 0.00014 | |
ops-embedding-dim-reduction-001 | USD/ドキュメント | 0.0007 | 0.0000071 | |
ops-bge-reranker-larger | USD/ドキュメント | 0.00014 | 0.000013 | |
ops-text-reranker-001 | 0.00014 | 0.000062 | ||
ops-qwen3-reranker-0.6b | 0.00014 | 0.000015 | ||
ops-video-snapshot-001 | USD/1,000 単位 | 0.016 | ||
ops-audio-asr-001 | USD/時間 | 0.09 | ||
検索エンジン | Alibaba Cloud Elasticsearch: オープンソースの Elasticsearch をベースに構築された完全マネージド型のクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使用できる従量課金制をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。 | |||
OpenSearch-Vector Search Edition: 課金の詳細については、「Vector Search Edition」をご参照ください。 | ||||
qwen3-235b-a22b | USD/1,000 トークン | 入力: 0.00056 出力: 0.0056 | ||
qwq-32b | 入力: 0.00028 出力: 0.00084 | |||
ops-qwen-turbo | 入力: 0.00006 出力: 0.0001 | |||
qwen-turbo | 入力: 0.000042 出力: 0.000084 | |||
qwen-plus | 入力: 0.000112 出力: 0.00028 | |||
qwen-max | 入力: 0.000336 出力: 0.001344 | |||
deepseek-r1 | 入力: 0.00056 出力: 0.00224 | |||
deepseek-r1-distill-qwen-7b | 入力: 0.00007 出力: 0.00014 | |||
deepseek-r1-distill-qwen-14b | 入力: 0.00014 出力: 0.00042 | |||
deepseek-v3 | 入力: 0.00028 出力: 0.00112 | |||
| USD/呼び出し | 0.00735 | ||
USD/1,000 トークン | クエリの再書き込み: 入力: 0.000336 出力: 0.001344 | |||
ops-query-analyze-001 | USD/1,000 トークン | 意図認識と代替クエリ拡張:
| ||
自然言語から SQL (NL2SQL) への生成:
| ||||
評価モジュールは、ユーザーが質問をしてから検索拡張生成 (RAG) システムがコンテンツを取得し、LLM が回答を生成するまでの、AI 検索オープンプラットフォームが提供する RAG 開発プロセスを包括的に評価するために使用されます。 | USD/1,000 トークン | 入力: 0.0007 出力: 0.0021 | ||
モデルのカスタマイズ
モデル名 | 説明 | 価格 |
ベクトル次元削減モデルのカスタムトレーニングでは、提供されたベクトルデータに基づいてベクトル次元削減モデルをカスタマイズできます。実際のビジネスシナリオでは、まず埋め込みモデルを使用してテキストやクエリをベクトル化し、次にベクトル次元削減モデルを使用してベクトルの次元をさらに削減します。 | 消費された計算資源の CU 数に基づいて課金されます。各 CU の価格は 0.5422614 USD です。 消費される CU 数は、トレーニングデータの量と次元によって異なります。たとえば、100,000 個の 1024 次元のデータでモデルをトレーニングするには、約 250 CU が消費され、料金は 250 × 0.5422614 = 135.56535 USD となります。 |
モデルのデプロイ
課金計算式: CU 価格 × インスタンスタイプあたりの CU 数 × インスタンス数
次の表に課金ルールを示します。
インスタンスタイプ | CU 価格 (USD/時間) | マシンあたりの CU 数 | マシンあたりの価格 (USD/時間) |
gpu.v100.16g.x1 | 0.15 | 30.14 | 4.521 |
gpu.t4.16g.x1 | 16.07 | 2.4105 | |
gpu.a10.24g.x1 | 11.01 | 1.6515 |
たとえば、2 つの gpu.a10.24g.x1 インスタンスを購入してモデルサービスをデプロイする場合、料金は次のように計算されます: 0.15 × 11.01 × 2 = 3.303 USD/時間。
サービス開発
インスタンスを起動すると、従量課金制で課金されます。料金は、次の式を使用して計算されます: CU 価格 × インスタンスタイプあたりの CU 数 × インスタンス数。
次の表に課金ルールを示します。
インスタンスタイプ | CU 価格 (USD/時間) | マシンあたりの CU 数 | マシンあたりの価格 (USD/時間) |
gpu.t4.16g.x1 | 0.15 | 16.07 | 2.4105 |
ops.basic1.gi.large | 0.61 | 0.0915 |
たとえば、1 つの ops.basic1.gi.large インスタンスを選択した場合、料金は次のように計算されます: 0.15 × 0.61 × 1 = 0.0915 USD/時間。
注意事項
サービス名は、サービス ID および API パラメータと 1 対 1 で対応しています。詳細については、「サービス概要」をご参照ください。
請求書は、実際の使用状況に基づいて 1 時間ごとに生成されます。
段階的価格設定のサービスの場合、料金は各段階の使用状況に基づいて計算されます。
1,000 トークンを課金単位として使用するサービスの場合、使用状況の統計に小数が含まれる場合があります。
サービスの中断を避けるため、Alibaba Cloud アカウントに支払い遅延がないことを確認してください。
課金例
ドイツ (フランクフルト) リージョンで、ドキュメントチャンキングサービスを 1,000 単位で呼び出したとします。料金は次のように計算されます:
最初の 500 単位 (500 を含む) の料金: 0.0009 USD × 500 = 0.45 USD
500 単位を超える料金: 0.000003 USD × 500 = 0.0015 USD
合計料金: 0.45 + 0.0015 = 0.4515 USD