すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:課金方法と課金項目

最終更新日:Oct 22, 2025

このトピックでは、AI Search Open Platform の課金項目、課金方法、および課金ルールについて説明します。

課金項目

AI Search Open Platform では、以下の項目について課金されます。

説明

AI Search Open Platform は無料で有効化できます。サービスを使用しない場合は課金されません。

課金方法

検索エンジンサービスを除き、AI 検索オープンプラットフォームのすべてのサービスは従量課金制です。料金は、サービス呼び出しの回数と、カスタムモデルトレーニングで消費されたコンピュートユニット (CU) で測定される課金時間に基づいて計算されます。請求書は 1 時間ごとに生成されます。すべての時間単位の請求書は 1 つの注文にまとめられ、合計料金が Alibaba Cloud アカウントから差し引かれます。

重要

2024 年 7 月 4 日 17:00 以降、一部のサービスは段階的価格設定を採用しています。詳細については、以下のセクションの詳細な課金ルールをご参照ください。

課金ルール

モデル呼び出し

大規模言語モデル (LLM) では、トークンはモデルが処理および理解できるテキストの最小単位です。トークンは通常、単語、句、文字、記号などのテキストセグメントを表します。モデルによってチャンク方法は異なり、文字数とトークン数は 1 対 1 で対応しない場合があります。

AI Search Open Platform でのモデル呼び出しで使用されるトークンの課金単位は、USD/1,000 トークンです。一部のサービスは段階的価格設定を採用しており、一部のサービスは入力トークンと出力トークンに基づいて課金されます。

説明

一部のモデルは、トークン計算 をサポートしており、呼び出しによって生成されるトークン数を推定できます。

段階的価格設定の例:

ドイツ (フランクフルト) リージョンで、スパーステキスト埋め込みサービスを呼び出して 1,000,000 トークン (1,000 課金単位に相当) を生成した場合、料金は次のように計算されます: 500 × 0.001 + 500 × 0.0004 = 0.7 USD。

入力と出力の課金の例:

ドイツ (フランクフルト) リージョンで、大規模言語モデル qwen3-235b-a22b を呼び出して 1,000 の入力トークンと 1,000 の出力トークンを生成した場合、料金は次のように計算されます:

1 × 0.0007 + 1 × 0.0028 = 0.0035 USD。

ドイツ (フランクフルト) リージョン

モデル名

モデル ID

課金単位

0~500 単位の価格

500 単位を超える価格

ドキュメントコンテンツ解析

ops-document-analyze-001

USD/1,000 トークン

0.0009

0.000272

USD/画像

0.00073

USD/表

0.00157

ドキュメントコンテンツ解析 - 意味理解に基づく階層構造の抽出

説明

ドキュメントコンテンツ解析サービスを呼び出す場合、パラメータを使用して、意味理解に基づくドキュメント階層構造の抽出機能を有効にするかどうかを制御できます。この機能が有効になっている場合、ドキュメント解析料金に加えて、この機能に対して 0.00052 USD/1,000 トークンが課金されます。

USD/1,000 トークン

0.00052

画像テキスト認識

ops-image-analyze-ocr-001

USD/呼び出し

0.012

0.0031

画像コンテンツ理解

ops-image-analyze-vlm-001

USD/1,000 トークン

0.011

ドキュメントチャンキング

ops-document-split-001

USD/1,000 トークン

0.0009

0.000003

テキスト埋め込み

ops-text-embedding-001

USD/1,000 トークン

0.0009

0.000072

ops-text-embedding-002

0.0009

0.000054

ops-text-embedding-zh-001

0.0009

0.000022

ops-text-embedding-en-001

0.0009

0.000019

ops-gte-sentence-embedding-multilingual-base

0.0009

0.00003

ops-qwen3-embedding- 0.6b

0.0009

0.000062

マルチモーダル埋め込み

テキストと画像の埋め込みに使用

ops-m2-encoder

テキスト埋め込み

USD/1,000 トークン

0.0009

0.000039

ops-m2-encoder

画像埋め込み

USD/画像

0.0009

0.000032

ops-m2-encoder-large

テキスト埋め込み

USD/1,000 トークン

0.0009

0.000065

ops-m2-encoder-large

画像ベクトル化

USD/画像

0.0009

0.000042

ops-gme-qwen2-vl-2b-instruct

テキスト埋め込み

USD/1,000 トークン

0.0009

0.000162

ops-gme-qwen2-vl-2b-instruct

画像埋め込み

USD/画像

0.0009

0.000146

スパーステキスト埋め込み

ops-text-sparse-embedding-001

USD/1,000 トークン

0.001

0.0004

ベクトル次元削減サービス

ops-embedding-dim-reduction-001

USD/ドキュメント

0.0009

0.0000064

ソートサービス

ops-bge-reranker-larger

USD/ドキュメント

0.0005

0.000048

ops-text-reranker-001

0.0005

0.00016

ops-qwen3-reranker- 0.6b

0.0005

0.000026

ビデオスナップショット

ops-video-snapshot-001

USD/1,000 画像

0.03

音声認識

ops-audio-asr-001

USD/時間

0.2

検索エンジン

Alibaba Cloud Elasticsearch: オープンソースの Elasticsearch をベースに構築された完全マネージド型のクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使用できる従量課金制をサポートしています。詳細については、「Elasticsearch」をご参照ください。

OpenSearch-Vector Search Edition: 課金の詳細については、「Vector Search Edition」をご参照ください。

LLM

qwen3-235b-a22b

USD/1,000 トークン

入力: 0.0007

出力: 0.0028

ops-qwen-turbo

入力: 0.000065

出力: 0.00026

qwen-turbo

入力: 0.00005

出力: 0.0002

qwen-plus

入力: 0.0004

出力: 0.0012

qwen-max

入力: 0.0016

出力: 0.0064

クエリ分析

ops-query-analyze-001

USD/1,000 トークン

入力: 0.004

出力: 0.018

中国 (上海) リージョン

モデル名

モデル ID

課金単位

0-500 単位の価格

500 単位を超える価格

ドキュメントコンテンツ解析

ops-document-analyze-001

USD/1,000 トークン

0.0007

0.00085

USD/イメージ

0.0023

USD/テーブル

0.005

ドキュメントコンテンツ解析 - 意味理解に基づく階層構造の抽出

説明

ドキュメントコンテンツ解析サービスを呼び出す際、パラメーターを使用して意味理解に基づくドキュメント階層構造の抽出機能を有効にするかどうかを制御できます。この機能が有効な場合、ドキュメント解析料金に加えて、この機能に対して 0.00031 USD/1,000 トークンが課金されます。

USD/1,000 トークン

0.00031

画像テキスト認識

ops-image-analyze-ocr-001

USD/呼び出し

0.0112

0.0058

画像コンテンツ理解

ops-image-analyze-vlm-001

USD/1,000 トークン

0.0093

ドキュメントチャンキング

ops-document-split-001

USD/1,000 トークン

0.0007

0.000003

テキスト埋め込み

ops-text-embedding-001

USD/1,000 トークン

0.0007

0.000023

ops-text-embedding-002

0.0007

0.00007

ops-text-embedding-zh-001

0.0007

0.00001

ops-text-embedding-en-001

0.0007

0.000011

ops-gte-sentence-embedding-multilingual-base

0.0007

0.000025

ops-qwen3-embedding-0.6b

0.0007

0.000071

マルチモーダル埋め込み

テキストと画像の埋め込みに使用

ops-m2-encoder

テキスト埋め込み

USD/1,000 トークン

0.0007

0.000026

ops-m2-encoder

画像埋め込み

USD/イメージ

0.0007

0.0000162

ops-m2-encoder-large

テキスト埋め込み

USD/1,000 トークン

0.0007

0.000067

ops-m2-encoder-large

画像埋め込み

USD/イメージ

0.0007

0.000033

ops-gme-qwen2-vl-2b-instruct

テキスト埋め込み

USD/1,000 トークン

0.0007

0.00008

ops-gme-qwen2-vl-2b-instruct

画像ベクトル化

USD/イメージ

0.0007

0.000072

スパーステキスト埋め込み

ops-text-sparse-embedding-001

USD/1,000 トークン

0.00084

0.00014

ベクトル次元削減サービス

ops-embedding-dim-reduction-001

USD/ドキュメント

0.0007

0.0000071

ソートサービス

ops-bge-reranker-larger

USD/ドキュメント

0.00014

0.000013

ops-text-reranker-001

0.00014

0.000062

ops-qwen3-reranker-0.6b

0.00014

0.000015

ビデオスナップショット

ops-video-snapshot-001

USD/1,000 単位

0.016

音声認識

ops-audio-asr-001

USD/時間

0.09

検索エンジン

Alibaba Cloud Elasticsearch: オープンソースの Elasticsearch をベースに構築された完全マネージド型のクラウドサービスです。オープンソースの機能と 100% 互換性があり、すぐに使用できる従量課金制をサポートしています。詳細については、「Alibaba Cloud ES」をご参照ください。

OpenSearch-Vector Search Edition: 課金の詳細については、「Vector Search Edition」をご参照ください。

LLM

qwen3-235b-a22b

USD/1,000 トークン

入力: 0.00056

出力: 0.0056

qwq-32b

入力: 0.00028

出力: 0.00084

ops-qwen-turbo

入力: 0.00006

出力: 0.0001

qwen-turbo

入力: 0.000042

出力: 0.000084

qwen-plus

入力: 0.000112

出力: 0.00028

qwen-max

入力: 0.000336

出力: 0.001344

deepseek-r1

入力: 0.00056

出力: 0.00224

deepseek-r1-distill-qwen-7b

入力: 0.00007

出力: 0.00014

deepseek-r1-distill-qwen-14b

入力: 0.00014

出力: 0.00042

deepseek-v3

入力: 0.00028

出力: 0.00112

Web 検索

  • Web 検索料金は次のように計算されます: 呼び出し料金 + クエリ再書き込み料金

    デフォルトでは、Web 検索中のクエリの再書き込みに qwen-max モデルが使用されます。
  • 使用方法: Web 検索は次の 2 つの方法で使用できます:

    • Web 検索 API を直接呼び出す。

    • LLM を使用する際に Web 検索を有効にする。

USD/呼び出し

0.00735

USD/1,000 トークン

クエリの再書き込み:

入力: 0.000336

出力: 0.001344

クエリ分析

ops-query-analyze-001

USD/1,000 トークン

意図認識と代替クエリ拡張:

  • 入力: 0.001

  • 出力: 0.004

自然言語から SQL (NL2SQL) への生成:

  • 入力: 0.00031

  • 出力: 0.00078

評価

評価モジュールは、ユーザーが質問をしてから検索拡張生成 (RAG) システムがコンテンツを取得し、LLM が回答を生成するまでの、AI 検索オープンプラットフォームが提供する RAG 開発プロセスを包括的に評価するために使用されます。

USD/1,000 トークン

入力: 0.0007

出力: 0.0021

モデルのカスタマイズ

モデル名

説明

価格

ベクトル次元削減モデルのカスタムトレーニング

ベクトル次元削減モデルのカスタムトレーニングでは、提供されたベクトルデータに基づいてベクトル次元削減モデルをカスタマイズできます。実際のビジネスシナリオでは、まず埋め込みモデルを使用してテキストやクエリをベクトル化し、次にベクトル次元削減モデルを使用してベクトルの次元をさらに削減します。

消費された計算資源の CU 数に基づいて課金されます。各 CU の価格は 0.5422614 USD です。

消費される CU 数は、トレーニングデータの量と次元によって異なります。たとえば、100,000 個の 1024 次元のデータでモデルをトレーニングするには、約 250 CU が消費され、料金は 250 × 0.5422614 = 135.56535 USD となります。

モデルのデプロイ

課金計算式: CU 価格 × インスタンスタイプあたりの CU 数 × インスタンス数

次の表に課金ルールを示します。

インスタンスタイプ

CU 価格 (USD/時間)

マシンあたりの CU 数

マシンあたりの価格 (USD/時間)

gpu.v100.16g.x1

0.15

30.14

4.521

gpu.t4.16g.x1

16.07

2.4105

gpu.a10.24g.x1

11.01

1.6515

たとえば、2 つの gpu.a10.24g.x1 インスタンスを購入してモデルサービスをデプロイする場合、料金は次のように計算されます: 0.15 × 11.01 × 2 = 3.303 USD/時間。

サービス開発

インスタンスを起動すると、従量課金制で課金されます。料金は、次の式を使用して計算されます: CU 価格 × インスタンスタイプあたりの CU 数 × インスタンス数。

次の表に課金ルールを示します。

インスタンスタイプ

CU 価格 (USD/時間)

マシンあたりの CU 数

マシンあたりの価格 (USD/時間)

gpu.t4.16g.x1

0.15

16.07

2.4105

ops.basic1.gi.large

0.61

0.0915

たとえば、1 つの ops.basic1.gi.large インスタンスを選択した場合、料金は次のように計算されます: 0.15 × 0.61 × 1 = 0.0915 USD/時間。

注意事項

  • サービス名は、サービス ID および API パラメータと 1 対 1 で対応しています。詳細については、「サービス概要」をご参照ください。

  • 請求書は、実際の使用状況に基づいて 1 時間ごとに生成されます。

  • 段階的価格設定のサービスの場合、料金は各段階の使用状況に基づいて計算されます。

  • 1,000 トークンを課金単位として使用するサービスの場合、使用状況の統計に小数が含まれる場合があります。

  • サービスの中断を避けるため、Alibaba Cloud アカウントに支払い遅延がないことを確認してください。

課金例

ドイツ (フランクフルト) リージョンで、ドキュメントチャンキングサービスを 1,000 単位で呼び出したとします。料金は次のように計算されます:

  • 最初の 500 単位 (500 を含む) の料金: 0.0009 USD × 500 = 0.45 USD

  • 500 単位を超える料金: 0.000003 USD × 500 = 0.0015 USD

  • 合計料金: 0.45 + 0.0015 = 0.4515 USD

参考資料

課金詳細を表示する