すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:課金とコスト管理

最終更新日:Mar 28, 2026

このトピックでは、課金明細の照会方法、請求書の分析方法、および課金停止方法について説明します。

課金明細の照会

説明

Coding Plan は従量課金の請求書を生成しません。ご利用のプラン使用状況は、またはCoding Plan ページでご確認ください。

課金サイクル

システムは、実際の API 呼び出しが発生した後にのみ請求書を生成します。

  • 大規模言語モデル (LLM) 推論: 請求書は分単位で生成されます。

  • その他のサービス(バッチ推論、モデルトレーニング、ナレッジベースなど): 請求書は時間単位で生成されます。

請求書の生成には遅延が発生する場合があります。たとえば、LLM 推論の請求書は通常、呼び出し後 2~10 分程度で表示されます。トラフィックのピーク時などは、システムによる最終的な請求書生成時刻を基準としてください。

1. 特定モデルの推論コストの照会

qwen-plus などの特定モデルの推論コストを確認するには、次の手順に従ってください。

  1. 詳細請求書ページで、課金サイクルを選択します。

  2. プロダクト詳細ModelStudio LLM Inferenceとして選択し、検索をクリックします。

  3. インスタンス ID列で、qwen-plus に関連付けられたすべてのインスタンスを検索します。

  4. 該当インスタンスの請求金額を合計します。この合計金額が、選択した月における該当モデルの推論コストの総額です。

image

2. Alibaba Cloud Model Studio サービスの総コストの照会

Model Studio 全体または特定のサービスタイプの支出傾向を確認するには、コスト分析機能をご利用ください。

「モデル推論」サービスの総コストの確認

  1. コスト分析ページで、コストタイプ請求金額に設定します。

  2. 時間粒度に設定します。日付範囲(例:2025 年 5 月~2025 年 10 月)を選択します。

  3. プロダクト詳細ModelStudio LLM Inferenceに設定します。選択した期間のモデル推論コストの合計が表示されます。

image

「Alibaba Cloud Model Studio」全サービスの総コストの確認

  1. コスト分析ページで、コストタイプ請求金額に設定します。

  2. 時間粒度に設定します。日付範囲(例:2025 年 10 月)を選択します。

  3. プロダクトAlibaba Cloud Model Studioに設定します。選択した期間の Model Studio コストの合計が表示されます。

image

3. 詳細請求書でのトークン使用量の照会

課金明細 ページで、詳細請求書 タブに移動し、課金項目 の統計情報を設定してから請求書をエクスポートしてください。エクスポートされたファイルにトークン使用量が記載されています。

image

課金明細の分析

2024 年 9 月 7 日以降、Alibaba Cloud Model Studio では、LLM 推論、デプロイメント、トレーニングの請求書について、より詳細な検証が可能になりました。API キー ID、ワークスペース ID、モデル名、入出力タイプ、呼び出しチャンネルごとにコストを確認できます。

1. 請求書のダウンロード

  1. 詳細請求書ページで、課金サイクルを選択します。

  2. プロダクトAlibaba Cloud Model Studioとして選択し、検索をクリックします。

  3. 請求書一覧の右上隅にある請求書のエクスポート (CSV)をクリックして、請求書をローカルデバイスにダウンロードします。

  4. ファイルを開き、インスタンス ID列を確認します。以下のルールに基づいてエントリを検証してください。

2. 主要フィールドの解釈

「インスタンス ID」フィールド: このフィールドには複数のセグメントが含まれており、通常はセミコロン (;) で区切られています。

  • 例: text_token;llm-xxx;qwen-max;output_token;app

  • これは 課金タイプ;ワークスペース ID;モデル名;入出力タイプ;呼び出しチャンネル を表します。

3. データのトレーサビリティと用語

  • API キーの照会: 請求書から API キー ID をコピーし、Model Studio API キー管理ページで一致するキー名を検索します。

  • ワークスペースの照会: 請求書から ワークスペース ID をコピーし、ワークスペース管理ページで ID を確認します。

  • 呼び出しチャンネルの定義:

    • app: アプリケーション(コード)からモデルを呼び出しました。

    • bmp: コンソールのモデル体験からモデルを呼び出しました。

    • assistant-api: Assistant API 経由でモデルを呼び出しました。

課金の停止(サービスの無効化)

Model Studio サービスが不要になった場合は、課金を停止して追加料金を回避してください。

1. Coding Plan サブスクリプションのキャンセル

Coding Plan は月額サブスクリプション製品です。有効期限に自動的に停止するため、手動でのキャンセルは不要です。自動更新を無効にするには、またはCoding Plan ページにアクセスして自動更新をオフにしてください。

2. モデル推論の停止

  • 操作: 関連機能の使用を停止します。たとえば、Alibaba Cloud Model Studio コンソールでのモデル体験を停止し、コード内のすべての API 呼び出しを停止します。

  • 推奨: 誤った呼び出しを防止するには、Alibaba Cloud Model Studio コンソールにアクセスします。右上隅で対象リージョンを選択し、API キーページに移動して作成済みの API キーを削除してください。

    image

3. モデルトレーニングの停止

  • 操作: トレーニングジョブが実行されていない場合、課金は発生しません。

よくある質問

Q: モデルを呼び出した直後に請求書が表示されないのはなぜですか?

A: 考えられる理由は以下のとおりです。

  1. 課金の遅延: LLM 推論の請求書は分単位で生成されます。通常、呼び出し後 2~10 分で表示されます。その他のサービス(バッチ推論、モデルトレーニング、ナレッジベースなど)の請求書は時間単位で生成されます。トラフィックのピーク時には遅延が発生する場合があります。システムによる実際の請求書生成時刻を基準としてください。

  2. 商用モデル以外(パブリックプレビューまたは招待プレビュー)を使用した: これらのモデルは請求書を生成しません。

Q: 従量課金はリアルタイムですか?

A: いいえ。Alibaba Cloud の従量課金は「事前確保+月次決済」モデルを採用しています。システムはまずご利用の残高の一部を凍結します。各課金サイクル終了時(翌月初旬)に最終的な請求書を生成し、金額を差し引きます。

Q: モデル呼び出し回数と統計情報をどこで確認できますか?

A: Alibaba Cloud Model Studio コンソールにアクセスします。右上隅で対象リージョンを選択し、モデルモニタリングページに移動してモデル呼び出しの統計情報を確認します。