このトピックでは、課金明細の照会方法、請求書の分析方法、および課金停止方法について説明します。
課金明細の照会
Coding Plan は従量課金の請求書を生成しません。ご利用のプラン使用状況は、またはCoding Plan ページでご確認ください。
課金サイクル
システムは、実際の API 呼び出しが発生した後にのみ請求書を生成します。
大規模言語モデル (LLM) 推論: 請求書は分単位で生成されます。
その他のサービス(バッチ推論、モデルトレーニング、ナレッジベースなど): 請求書は時間単位で生成されます。
請求書の生成には遅延が発生する場合があります。たとえば、LLM 推論の請求書は通常、呼び出し後 2~10 分程度で表示されます。トラフィックのピーク時などは、システムによる最終的な請求書生成時刻を基準としてください。
1. 特定モデルの推論コストの照会
qwen-plus などの特定モデルの推論コストを確認するには、次の手順に従ってください。
詳細請求書ページで、課金サイクルを選択します。
プロダクト詳細をModelStudio LLM Inferenceとして選択し、検索をクリックします。
インスタンス ID列で、qwen-plus に関連付けられたすべてのインスタンスを検索します。
該当インスタンスの請求金額を合計します。この合計金額が、選択した月における該当モデルの推論コストの総額です。

2. Alibaba Cloud Model Studio サービスの総コストの照会
Model Studio 全体または特定のサービスタイプの支出傾向を確認するには、コスト分析機能をご利用ください。
3. 詳細請求書でのトークン使用量の照会
課金明細 ページで、詳細請求書 タブに移動し、課金項目 の統計情報を設定してから請求書をエクスポートしてください。エクスポートされたファイルにトークン使用量が記載されています。

課金明細の分析
2024 年 9 月 7 日以降、Alibaba Cloud Model Studio では、LLM 推論、デプロイメント、トレーニングの請求書について、より詳細な検証が可能になりました。API キー ID、ワークスペース ID、モデル名、入出力タイプ、呼び出しチャンネルごとにコストを確認できます。
1. 請求書のダウンロード
詳細請求書ページで、課金サイクルを選択します。
プロダクトをAlibaba Cloud Model Studioとして選択し、検索をクリックします。
請求書一覧の右上隅にある請求書のエクスポート (CSV)をクリックして、請求書をローカルデバイスにダウンロードします。
ファイルを開き、インスタンス ID列を確認します。以下のルールに基づいてエントリを検証してください。
2. 主要フィールドの解釈
「インスタンス ID」フィールド: このフィールドには複数のセグメントが含まれており、通常はセミコロン (;) で区切られています。
例:
text_token;llm-xxx;qwen-max;output_token;appこれは
課金タイプ;ワークスペース ID;モデル名;入出力タイプ;呼び出しチャンネルを表します。
3. データのトレーサビリティと用語
API キーの照会: 請求書から
API キー IDをコピーし、Model Studio API キー管理ページで一致するキー名を検索します。ワークスペースの照会: 請求書から
ワークスペース IDをコピーし、ワークスペース管理ページで ID を確認します。呼び出しチャンネルの定義:
app: アプリケーション(コード)からモデルを呼び出しました。bmp: コンソールのモデル体験からモデルを呼び出しました。assistant-api: Assistant API 経由でモデルを呼び出しました。
課金の停止(サービスの無効化)
Model Studio サービスが不要になった場合は、課金を停止して追加料金を回避してください。
1. Coding Plan サブスクリプションのキャンセル
Coding Plan は月額サブスクリプション製品です。有効期限に自動的に停止するため、手動でのキャンセルは不要です。自動更新を無効にするには、またはCoding Plan ページにアクセスして自動更新をオフにしてください。
2. モデル推論の停止
操作: 関連機能の使用を停止します。たとえば、Alibaba Cloud Model Studio コンソールでのモデル体験を停止し、コード内のすべての API 呼び出しを停止します。
推奨: 誤った呼び出しを防止するには、Alibaba Cloud Model Studio コンソールにアクセスします。右上隅で対象リージョンを選択し、API キーページに移動して作成済みの API キーを削除してください。

3. モデルトレーニングの停止
操作: トレーニングジョブが実行されていない場合、課金は発生しません。
よくある質問
Q: モデルを呼び出した直後に請求書が表示されないのはなぜですか?
A: 考えられる理由は以下のとおりです。
課金の遅延: LLM 推論の請求書は分単位で生成されます。通常、呼び出し後 2~10 分で表示されます。その他のサービス(バッチ推論、モデルトレーニング、ナレッジベースなど)の請求書は時間単位で生成されます。トラフィックのピーク時には遅延が発生する場合があります。システムによる実際の請求書生成時刻を基準としてください。
商用モデル以外(パブリックプレビューまたは招待プレビュー)を使用した: これらのモデルは請求書を生成しません。
Q: 従量課金はリアルタイムですか?
A: いいえ。Alibaba Cloud の従量課金は「事前確保+月次決済」モデルを採用しています。システムはまずご利用の残高の一部を凍結します。各課金サイクル終了時(翌月初旬)に最終的な請求書を生成し、金額を差し引きます。
Q: モデル呼び出し回数と統計情報をどこで確認できますか?
A: Alibaba Cloud Model Studio コンソールにアクセスします。右上隅で対象リージョンを選択し、モデルモニタリングページに移動してモデル呼び出しの統計情報を確認します。

