Open Platform for AI Search は、実際の使用量に基づいて課金されます。プラットフォームの有効化は無料で、最初のサービス呼び出しを行うまで料金は発生しません。
請求額を左右する要因:ほとんどの料金はモデル呼び出しによるもので、サービスに応じてトークン、呼び出し、またはドキュメント単位で測定されます。カスタムモデルトレーニングとモデルデプロイは、コンピューティングユニット (CU) 単位で課金されます。検索エンジンバックエンドは、独自のプロダクトを通じて別途課金されます。
課金項目
| 項目 | 説明 | 利用可能なリージョン |
|---|---|---|
| モデル呼び出し | ドキュメントコンテンツ解析、テキスト埋め込み、ソートなどのサービスの呼び出しごとに課金されます | すべてのリージョン |
| モデルのカスタマイズ | ご利用のデータでカスタムモデルをトレーニングする場合に課金されます。例:サービス開発 (中国 (上海) リージョンのみ)モデルデプロイ (中国 (上海) リージョンのみ)モデルのカスタマイズ (中国 (上海) リージョンのみ)ベクトル次元削減サービスのカスタムトレーニング | 中国 (上海) のみ |
| モデルデプロイ | さまざまなソースからモデルをデプロイして呼び出す際に課金されます | 中国 (上海) のみ |
| サービス開発 | 統合された PAI Distribution Switch (DSW) 機能を通じてプラットフォーム上で Notebook を使用する際に課金されます | 中国 (上海) のみ |
課金方法
検索エンジンを除くすべてのサービスは、従量課金制です。料金は、サービス呼び出しの回数と、カスタムモデルトレーニングで消費されたコンピューティングユニット (CU) で測定される課金時間に基づきます。
請求は 1 時間ごとに生成されます。すべての時間単位の請求は 1 つの注文にまとめられ、ご利用の Alibaba Cloud アカウントから引き落とされます。
2024 年 7 月 4 日 17:00 以降、一部のサービスで段階的価格設定が採用されます。詳細については、以下の課金ルールのセクションをご参照ください。
課金ルール
ドイツ (フランクフルト) リージョンでの料金
|
モデル名 |
モデル ID |
課金単位 |
最初の 500 単位の価格 |
500 単位を超える分の価格 |
|
ops-document-analyze-001 |
USD/1,000 トークン |
0.0009 |
0.000272 |
|
|
USD/イメージ |
0.00073 |
|||
|
USD/テーブル |
0.00157 |
|||
|
ドキュメントコンテンツ解析 - セマンティックベースのドキュメント階層抽出 説明
ドキュメントコンテンツ解析サービスを呼び出す際に、パラメーターを使用してセマンティックベースのドキュメント階層抽出機能を有効にできます。有効にした場合、この機能はドキュメント解析料金に加えて、1,000 トークンあたり 0.00052 USD で課金されます。 |
USD/1,000 トークン |
0.00052 |
||
|
ops-image-analyze-ocr-001 |
USD/呼び出し |
0.012 |
0.0031 |
|
|
ops-image-analyze-vlm-001 |
USD/1,000 トークン |
0.011 |
||
|
ops-document-split-001 |
USD/1,000 トークン |
0.0009 |
0.000003 |
|
|
ops-text-embedding-001 |
USD/1,000 トークン |
0.0009 |
0.000072 |
|
|
ops-text-embedding-002 |
0.0009 |
0.000054 |
||
|
ops-text-embedding-zh-001 |
0.0009 |
0.000022 |
||
|
ops-text-embedding-en-001 |
0.0009 |
0.000019 |
||
|
ops-gte-sentence-embedding-multilingual-base |
0.0009 |
0.00003 |
||
|
ops-qwen3-embedding-0.6b |
0.0009 |
0.000062 |
||
テキストと画像の埋め込み用 |
ops-m2-encoder テキスト埋め込み |
USD/1,000 トークン |
0.0009 |
0.000039 |
|
ops-m2-encoder 画像埋め込み |
USD/イメージ |
0.0009 |
0.000032 |
|
|
ops-m2-encoder-large テキスト埋め込み |
USD/1,000 トークン |
0.0009 |
0.000065 |
|
|
ops-m2-encoder-large 画像埋め込み |
USD/イメージ |
0.0009 |
0.000042 |
|
|
ops-gme-qwen2-vl-2b-instruct テキスト埋め込み |
USD/1,000 トークン |
0.0009 |
0.000162 |
|
|
ops-gme-qwen2-vl-2b-instruct 画像埋め込み |
USD/イメージ |
0.0009 |
0.000146 |
|
|
ops-mm-embedding-face-001 画像埋め込み |
USD/1,000 トークン |
0.007 |
0.0007 |
|
|
ops-text-sparse-embedding-001 |
USD/1,000 トークン |
0.001 |
0.0004 |
|
|
ops-embedding-dim-reduction-001 |
USD/doc |
0.0009 |
0.0000064 |
|
|
ops-bge-reranker-larger |
USD/doc |
0.0005 |
0.000048 |
|
|
ops-text-reranker-001 |
0.0005 |
0.00016 |
||
|
ops-qwen3-reranker-0.6b |
0.0005 |
0.000026 |
||
|
ops-video-snapshot-001 |
USD/1,000 イメージ |
0.03 |
||
|
ops-audio-asr-001 |
USD/時間 |
0.2 |
||
|
検索エンジン |
Alibaba Cloud Elasticsearch:オープンソースの Elasticsearch 上に構築されたフルマネージドのクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使える使用方法と従量課金をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。 |
|||
|
OpenSearch - Vector Search Edition:課金の詳細については、「Vector Search Edition」をご参照ください。 |
||||
|
qwen3-235b-a22b |
USD/1,000 トークン |
入力:0.0007 出力:0.0028 |
||
|
ops-qwen-turbo |
入力:0.000065 出力:0.00026 |
|||
|
qwen-turbo |
入力:0.00005 出力:0.0002 |
|||
|
qwen-plus |
入力:0.0004 出力:0.0012 |
|||
|
qwen-max |
入力:0.0016 出力:0.0064 |
|||
|
ops-query-analyze-001 |
USD/1,000 トークン |
入力:0.004 出力:0.018 |
||
ドキュメントコンテンツ解析中に階層構造抽出を有効にすると、標準の解析料金に加えて、1,000 トークンあたり 0.00052 USD の追加料金が適用されます。
中国 (上海) リージョンでの料金
|
モデル名 |
モデル ID |
課金単位 |
最初の 500 単位の価格 |
500 単位を超える分の価格 |
|
ops-document-analyze-001 |
USD/1,000 トークン |
0.0007 |
0.00085 |
|
|
USD/イメージ |
0.0023 |
|||
|
USD/table |
0.005 |
|||
|
ドキュメントコンテンツ解析 - セマンティックベースのドキュメント階層抽出 説明
ドキュメントコンテンツ解析サービスを呼び出す際に、パラメーターを使用してセマンティックベースのドキュメント階層抽出機能を有効にできます。有効にした場合、この機能はドキュメント解析料金に加えて、1,000 トークンあたり 0.00031 USD で課金されます。 |
USD/1,000 トークン |
0.00031 |
||
|
ops-image-analyze-ocr-001 |
USD/呼び出し |
0.0112 |
0.0058 |
|
|
ops-image-analyze-vlm-001 |
USD/1,000 トークン |
0.0093 |
||
|
ops-document-split-001 |
USD/1,000 トークン |
0.0007 |
0.000003 |
|
|
ops-text-embedding-001 |
USD/1,000 トークン |
0.0007 |
0.000023 |
|
|
ops-text-embedding-002 |
0.0007 |
0.00007 |
||
|
ops-text-embedding-zh-001 |
0.0007 |
0.00001 |
||
|
ops-text-embedding-en-001 |
0.0007 |
0.000011 |
||
|
ops-gte-sentence-embedding-multilingual-base |
0.0007 |
0.000025 |
||
|
ops-qwen3-embedding-0.6b |
0.0007 |
0.000071 |
||
テキストと画像の埋め込み用 |
ops-m2-encoder テキスト埋め込み |
USD/1,000 トークン |
0.0007 |
0.000026 |
|
ops-m2-encoder 画像埋め込み |
USD/イメージ |
0.0007 |
0.0000162 |
|
|
ops-m2-encoder-large テキスト埋め込み |
USD/1,000 トークン |
0.0007 |
0.000067 |
|
|
ops-m2-encoder-large 画像埋め込み |
USD/イメージ |
0.0007 |
0.000033 |
|
|
ops-gme-qwen2-vl-2b-instruct テキスト埋め込み |
USD/1,000 トークン |
0.0007 |
0.00008 |
|
|
ops-gme-qwen2-vl-2b-instruct 画像埋め込み |
USD/イメージ |
0.0007 |
0.000072 |
|
|
ops-mm-embedding-face-001 画像埋め込み |
USD/1,000 トークン |
0.0041 |
0.00041 |
|
|
ops-text-sparse-embedding-001 |
USD/1,000 トークン |
0.00084 |
0.00014 |
|
|
ops-embedding-dim-reduction-001 |
USD/doc |
0.0007 |
0.0000071 |
|
|
ops-bge-reranker-larger |
USD/doc |
0.00014 |
0.000013 |
|
|
ops-text-reranker-001 |
0.00014 |
0.000062 |
||
|
ops-qwen3-reranker-0.6b |
0.00014 |
0.000015 |
||
|
ops-video-snapshot-001 |
USD/1,000 イメージ |
0.016 |
||
|
ops-audio-asr-001 |
USD/時間 |
0.09 |
||
|
検索エンジン |
Alibaba Cloud Elasticsearch:オープンソースの Elasticsearch 上に構築されたフルマネージドのクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使える使用方法と従量課金をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。 |
|||
|
OpenSearch - Vector Search Edition:課金の詳細については、「Vector Search Edition」をご参照ください。 |
||||
|
qwen3-235b-a22b |
USD/1,000 トークン |
入力:0.00056 出力:0.0056 |
||
|
qwq-32b |
入力:0.00028 出力:0.00084 |
|||
|
ops-qwen-turbo |
入力:0.00006 出力:0.0001 |
|||
|
qwen-turbo |
入力:0.000042 出力:0.000084 |
|||
|
qwen-plus |
入力:0.000112 出力:0.00028 |
|||
|
qwen-max |
入力:0.000336 出力:0.001344 |
|||
|
deepseek-r1 |
入力:0.00056 出力:0.00224 |
|||
|
deepseek-r1-distill-qwen-7b |
入力:0.00007 出力:0.00014 |
|||
|
deepseek-r1-distill-qwen-14b |
入力:0.00014 出力:0.00042 |
|||
|
deepseek-v3 |
入力:0.00028 出力:0.00112 |
|||
|
USD/呼び出し |
0.00735 |
||
|
USD/1,000 トークン |
クエリ書き換え: 入力:0.000336 出力:0.001344 |
|||
|
ops-query-analyze-001 |
USD/1,000 トークン |
意図認識、類似クエリ拡張:
|
||
|
NL2SQL 生成:
|
||||
|
パフォーマンス評価モジュールを使用して、Open Platform for AI Search が提供する検索拡張生成 (RAG) 開発フロー全体を評価します。評価は、ユーザーの最初の質問から RAG システムによるコンテンツ取得、LLM による回答生成までのプロセスを対象とします。 |
USD/1,000 トークン |
入力:0.0007 出力:0.0021 |
||
Web 検索の課金 = 呼び出し料金 + クエリ書き換え料金。デフォルトでは、クエリ書き換えに qwen-max モデルが使用されます。Web 検索は、Web 検索 API を直接呼び出すか、LLM を使用する際に有効にすることで呼び出します。
ドキュメントコンテンツ解析中に階層構造抽出を有効にすると、標準の解析料金に加えて、1,000 トークンあたり 0.00031 USD の追加料金が適用されます。
モデルのカスタマイズ
モデルのカスタマイズは、中国 (上海) リージョンでのみ利用可能です。
| モデル | 説明 | 価格 |
|---|---|---|
| ベクトル次元削減モデルのカスタムトレーニング | 独自のベクトルデータを使用して、カスタムのベクトル次元削減モデルをトレーニングします。実際には、まず埋め込みモデルでテキストやクエリをベクトル化し、その後このモデルを使用してさらにベクトル次元を削減します。 | CU あたり 0.5422614 USD。消費される CU 数は、トレーニングデータの量と次元数によって異なります。例えば、1024 次元のデータ 100,000 件でトレーニングすると、約 250 CU を消費し、合計で 250 × 0.5422614 = 135.56535 USD となります。 |
モデルデプロイ
モデルデプロイは、中国 (上海) リージョンでのみ利用可能です。
課金計算式:CU 価格 × インスタンスタイプごとの CU 数 × インスタンス数。
|
インスタンスタイプ |
CU 価格 (USD/時間) |
インスタンスごとに消費される CU |
インスタンスあたりの価格 (USD/時間) |
|
gpu.v100.16g.x1 |
0.15 |
30.14 |
4.521 |
|
gpu.t4.16g.x1 |
16.07 |
2.4105 |
|
|
gpu.a10.24g.x1 |
11.01 |
1.6515 |
例:2 つの gpu.a10.24g.x1 インスタンスをデプロイする場合:0.15 × 11.01 × 2 = 3.303 USD/時間。
サービス開発
サービス開発は、中国 (上海) リージョンでのみ利用可能です。
インスタンスを起動すると課金が開始され、同じ計算式が使用されます:CU 価格 × インスタンスタイプごとの CU 数 × インスタンス数。
|
インスタンスタイプ |
CU 価格 (USD/時間) |
インスタンスごとに消費される CU |
インスタンスあたりの価格 (USD/時間) |
|
gpu.t4.16g.x1 |
0.15 |
16.07 |
2.4105 |
|
ops.basic1.gi.large |
0.61 |
0.0915 |
例:1 つの ops.basic1.gi.large インスタンスを実行する場合:0.15 × 0.61 × 1 = 0.0915 USD/時間。
課金例
ドイツ (フランクフルト) リージョンで、ドキュメントチャンキングサービスを 1,000 課金単位で呼び出した場合:
-
最初の 500 単位:0.0009 USD × 500 = 0.45 USD
-
次の 500 単位:0.000003 USD × 500 = 0.0015 USD
-
合計:0.4515 USD
注意事項
-
サービス名はサービス ID および API パラメーターと 1 対 1 で対応します。完全なリストについては、「サービス概要」をご参照ください。
-
請求は、実際の使用量に基づいて時間単位で生成されます。
-
段階的価格設定のサービスの場合、料金は各段階の使用量に基づいて段階的に計算されます。
-
1,000 トークン単位で課金されるサービスの場合、使用量統計に小数点が含まれることがあります。
-
サービスの停止を避けるため、ご利用の Alibaba Cloud アカウントに支払い遅延がないようにしてください。