すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:課金方法

最終更新日:Apr 03, 2026

Open Platform for AI Search は、実際の使用量に基づいて課金されます。プラットフォームの有効化は無料で、最初のサービス呼び出しを行うまで料金は発生しません。

請求額を左右する要因:ほとんどの料金はモデル呼び出しによるもので、サービスに応じてトークン、呼び出し、またはドキュメント単位で測定されます。カスタムモデルトレーニングとモデルデプロイは、コンピューティングユニット (CU) 単位で課金されます。検索エンジンバックエンドは、独自のプロダクトを通じて別途課金されます。

課金項目

項目 説明 利用可能なリージョン
モデル呼び出し ドキュメントコンテンツ解析、テキスト埋め込み、ソートなどのサービスの呼び出しごとに課金されます すべてのリージョン
モデルのカスタマイズ ご利用のデータでカスタムモデルをトレーニングする場合に課金されます。例:サービス開発 (中国 (上海) リージョンのみ)モデルデプロイ (中国 (上海) リージョンのみ)モデルのカスタマイズ (中国 (上海) リージョンのみ)ベクトル次元削減サービスのカスタムトレーニング 中国 (上海) のみ
モデルデプロイ さまざまなソースからモデルをデプロイして呼び出す際に課金されます 中国 (上海) のみ
サービス開発 統合された PAI Distribution Switch (DSW) 機能を通じてプラットフォーム上で Notebook を使用する際に課金されます 中国 (上海) のみ

課金方法

検索エンジンを除くすべてのサービスは、従量課金制です。料金は、サービス呼び出しの回数と、カスタムモデルトレーニングで消費されたコンピューティングユニット (CU) で測定される課金時間に基づきます。

請求は 1 時間ごとに生成されます。すべての時間単位の請求は 1 つの注文にまとめられ、ご利用の Alibaba Cloud アカウントから引き落とされます。

重要

2024 年 7 月 4 日 17:00 以降、一部のサービスで段階的価格設定が採用されます。詳細については、以下の課金ルールのセクションをご参照ください。

課金ルール

ドイツ (フランクフルト) リージョンでの料金

モデル名

モデル ID

課金単位

最初の 500 単位の価格

500 単位を超える分の価格

ドキュメントコンテンツ解析

ops-document-analyze-001

USD/1,000 トークン

0.0009

0.000272

USD/イメージ

0.00073

USD/テーブル

0.00157

ドキュメントコンテンツ解析 - セマンティックベースのドキュメント階層抽出

説明

ドキュメントコンテンツ解析サービスを呼び出す際に、パラメーターを使用してセマンティックベースのドキュメント階層抽出機能を有効にできます。有効にした場合、この機能はドキュメント解析料金に加えて、1,000 トークンあたり 0.00052 USD で課金されます。

USD/1,000 トークン

0.00052

画像テキスト認識

ops-image-analyze-ocr-001

USD/呼び出し

0.012

0.0031

画像コンテンツ理解

ops-image-analyze-vlm-001

USD/1,000 トークン

0.011

ドキュメントチャンキング

ops-document-split-001

USD/1,000 トークン

0.0009

0.000003

テキスト埋め込み

ops-text-embedding-001

USD/1,000 トークン

0.0009

0.000072

ops-text-embedding-002

0.0009

0.000054

ops-text-embedding-zh-001

0.0009

0.000022

ops-text-embedding-en-001

0.0009

0.000019

ops-gte-sentence-embedding-multilingual-base

0.0009

0.00003

ops-qwen3-embedding-0.6b

0.0009

0.000062

マルチモーダル埋め込み

テキストと画像の埋め込み用

ops-m2-encoder

テキスト埋め込み

USD/1,000 トークン

0.0009

0.000039

ops-m2-encoder

画像埋め込み

USD/イメージ

0.0009

0.000032

ops-m2-encoder-large

テキスト埋め込み

USD/1,000 トークン

0.0009

0.000065

ops-m2-encoder-large

画像埋め込み

USD/イメージ

0.0009

0.000042

ops-gme-qwen2-vl-2b-instruct

テキスト埋め込み

USD/1,000 トークン

0.0009

0.000162

ops-gme-qwen2-vl-2b-instruct

画像埋め込み

USD/イメージ

0.0009

0.000146

ops-mm-embedding-face-001

画像埋め込み

USD/1,000 トークン

0.007

0.0007

スパーステキスト埋め込み

ops-text-sparse-embedding-001

USD/1,000 トークン

0.001

0.0004

ベクトル次元削減サービス

ops-embedding-dim-reduction-001

USD/doc

0.0009

0.0000064

ソートサービス

ops-bge-reranker-larger

USD/doc

0.0005

0.000048

ops-text-reranker-001

0.0005

0.00016

ops-qwen3-reranker-0.6b

0.0005

0.000026

ビデオスナップショット

ops-video-snapshot-001

USD/1,000 イメージ

0.03

音声認識

ops-audio-asr-001

USD/時間

0.2

検索エンジン

Alibaba Cloud Elasticsearch:オープンソースの Elasticsearch 上に構築されたフルマネージドのクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使える使用方法と従量課金をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。

OpenSearch - Vector Search Edition:課金の詳細については、「Vector Search Edition」をご参照ください。

大規模言語モデル (LLM)

qwen3-235b-a22b

USD/1,000 トークン

入力:0.0007

出力:0.0028

ops-qwen-turbo

入力:0.000065

出力:0.00026

qwen-turbo

入力:0.00005

出力:0.0002

qwen-plus

入力:0.0004

出力:0.0012

qwen-max

入力:0.0016

出力:0.0064

クエリ分析

ops-query-analyze-001

USD/1,000 トークン

入力:0.004

出力:0.018

ドキュメントコンテンツ解析中に階層構造抽出を有効にすると、標準の解析料金に加えて、1,000 トークンあたり 0.00052 USD の追加料金が適用されます。

中国 (上海) リージョンでの料金

モデル名

モデル ID

課金単位

最初の 500 単位の価格

500 単位を超える分の価格

ドキュメントコンテンツ解析

ops-document-analyze-001

USD/1,000 トークン

0.0007

0.00085

USD/イメージ

0.0023

USD/table

0.005

ドキュメントコンテンツ解析 - セマンティックベースのドキュメント階層抽出

説明

ドキュメントコンテンツ解析サービスを呼び出す際に、パラメーターを使用してセマンティックベースのドキュメント階層抽出機能を有効にできます。有効にした場合、この機能はドキュメント解析料金に加えて、1,000 トークンあたり 0.00031 USD で課金されます。

USD/1,000 トークン

0.00031

画像テキスト認識

ops-image-analyze-ocr-001

USD/呼び出し

0.0112

0.0058

画像コンテンツ理解

ops-image-analyze-vlm-001

USD/1,000 トークン

0.0093

ドキュメントチャンキング

ops-document-split-001

USD/1,000 トークン

0.0007

0.000003

テキスト埋め込み

ops-text-embedding-001

USD/1,000 トークン

0.0007

0.000023

ops-text-embedding-002

0.0007

0.00007

ops-text-embedding-zh-001

0.0007

0.00001

ops-text-embedding-en-001

0.0007

0.000011

ops-gte-sentence-embedding-multilingual-base

0.0007

0.000025

ops-qwen3-embedding-0.6b

0.0007

0.000071

マルチモーダル埋め込み

テキストと画像の埋め込み用

ops-m2-encoder

テキスト埋め込み

USD/1,000 トークン

0.0007

0.000026

ops-m2-encoder

画像埋め込み

USD/イメージ

0.0007

0.0000162

ops-m2-encoder-large

テキスト埋め込み

USD/1,000 トークン

0.0007

0.000067

ops-m2-encoder-large

画像埋め込み

USD/イメージ

0.0007

0.000033

ops-gme-qwen2-vl-2b-instruct

テキスト埋め込み

USD/1,000 トークン

0.0007

0.00008

ops-gme-qwen2-vl-2b-instruct

画像埋め込み

USD/イメージ

0.0007

0.000072

ops-mm-embedding-face-001

画像埋め込み

USD/1,000 トークン

0.0041

0.00041

スパーステキスト埋め込み

ops-text-sparse-embedding-001

USD/1,000 トークン

0.00084

0.00014

ベクトル次元削減サービス

ops-embedding-dim-reduction-001

USD/doc

0.0007

0.0000071

ソートサービス

ops-bge-reranker-larger

USD/doc

0.00014

0.000013

ops-text-reranker-001

0.00014

0.000062

ops-qwen3-reranker-0.6b

0.00014

0.000015

ビデオスナップショット

ops-video-snapshot-001

USD/1,000 イメージ

0.016

音声認識

ops-audio-asr-001

USD/時間

0.09

検索エンジン

Alibaba Cloud Elasticsearch:オープンソースの Elasticsearch 上に構築されたフルマネージドのクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使える使用方法と従量課金をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。

OpenSearch - Vector Search Edition:課金の詳細については、「Vector Search Edition」をご参照ください。

大規模言語モデル (LLM)

qwen3-235b-a22b

USD/1,000 トークン

入力:0.00056

出力:0.0056

qwq-32b

入力:0.00028

出力:0.00084

ops-qwen-turbo

入力:0.00006

出力:0.0001

qwen-turbo

入力:0.000042

出力:0.000084

qwen-plus

入力:0.000112

出力:0.00028

qwen-max

入力:0.000336

出力:0.001344

deepseek-r1

入力:0.00056

出力:0.00224

deepseek-r1-distill-qwen-7b

入力:0.00007

出力:0.00014

deepseek-r1-distill-qwen-14b

入力:0.00014

出力:0.00042

deepseek-v3

入力:0.00028

出力:0.00112

Web 検索

  • Web 検索料金 = 呼び出し料金 + クエリ書き換え料金

    Web 検索中、クエリ書き換えにはデフォルトで qwen-max モデルが使用されます。
  • 使用方法:Web 検索は以下の 2 つの方法で使用できます:

    • Web 検索 API を直接呼び出す

    • LLM を使用する際に Web 検索を有効にする

USD/呼び出し

0.00735

USD/1,000 トークン

クエリ書き換え:

入力:0.000336

出力:0.001344

クエリ分析

ops-query-analyze-001

USD/1,000 トークン

意図認識、類似クエリ拡張:

  • 入力:0.001

  • 出力:0.004

NL2SQL 生成:

  • 入力:0.00031

  • 出力:0.00078

パフォーマンス評価

パフォーマンス評価モジュールを使用して、Open Platform for AI Search が提供する検索拡張生成 (RAG) 開発フロー全体を評価します。評価は、ユーザーの最初の質問から RAG システムによるコンテンツ取得、LLM による回答生成までのプロセスを対象とします。

USD/1,000 トークン

入力:0.0007

出力:0.0021

Web 検索の課金 = 呼び出し料金 + クエリ書き換え料金。デフォルトでは、クエリ書き換えに qwen-max モデルが使用されます。Web 検索は、Web 検索 API を直接呼び出すか、LLM を使用する際に有効にすることで呼び出します。
ドキュメントコンテンツ解析中に階層構造抽出を有効にすると、標準の解析料金に加えて、1,000 トークンあたり 0.00031 USD の追加料金が適用されます。

モデルのカスタマイズ

モデルのカスタマイズは、中国 (上海) リージョンでのみ利用可能です。

モデル 説明 価格
ベクトル次元削減モデルのカスタムトレーニング 独自のベクトルデータを使用して、カスタムのベクトル次元削減モデルをトレーニングします。実際には、まず埋め込みモデルでテキストやクエリをベクトル化し、その後このモデルを使用してさらにベクトル次元を削減します。 CU あたり 0.5422614 USD。消費される CU 数は、トレーニングデータの量と次元数によって異なります。例えば、1024 次元のデータ 100,000 件でトレーニングすると、約 250 CU を消費し、合計で 250 × 0.5422614 = 135.56535 USD となります。

モデルデプロイ

モデルデプロイは、中国 (上海) リージョンでのみ利用可能です。

課金計算式:CU 価格 × インスタンスタイプごとの CU 数 × インスタンス数。

インスタンスタイプ

CU 価格 (USD/時間)

インスタンスごとに消費される CU

インスタンスあたりの価格 (USD/時間)

gpu.v100.16g.x1

0.15

30.14

4.521

gpu.t4.16g.x1

16.07

2.4105

gpu.a10.24g.x1

11.01

1.6515

:2 つの gpu.a10.24g.x1 インスタンスをデプロイする場合:0.15 × 11.01 × 2 = 3.303 USD/時間

サービス開発

サービス開発は、中国 (上海) リージョンでのみ利用可能です。

インスタンスを起動すると課金が開始され、同じ計算式が使用されます:CU 価格 × インスタンスタイプごとの CU 数 × インスタンス数。

インスタンスタイプ

CU 価格 (USD/時間)

インスタンスごとに消費される CU

インスタンスあたりの価格 (USD/時間)

gpu.t4.16g.x1

0.15

16.07

2.4105

ops.basic1.gi.large

0.61

0.0915

:1 つの ops.basic1.gi.large インスタンスを実行する場合:0.15 × 0.61 × 1 = 0.0915 USD/時間

課金例

ドイツ (フランクフルト) リージョンで、ドキュメントチャンキングサービスを 1,000 課金単位で呼び出した場合:

  • 最初の 500 単位:0.0009 USD × 500 = 0.45 USD

  • 次の 500 単位:0.000003 USD × 500 = 0.0015 USD

  • 合計:0.4515 USD

注意事項

  • サービス名はサービス ID および API パラメーターと 1 対 1 で対応します。完全なリストについては、「サービス概要」をご参照ください。

  • 請求は、実際の使用量に基づいて時間単位で生成されます。

  • 段階的価格設定のサービスの場合、料金は各段階の使用量に基づいて段階的に計算されます。

  • 1,000 トークン単位で課金されるサービスの場合、使用量統計に小数点が含まれることがあります。

  • サービスの停止を避けるため、ご利用の Alibaba Cloud アカウントに支払い遅延がないようにしてください。

次のステップ

課金詳細の表示

参考資料