料金概要 | Alibaba Cloud Model Studio の有効化は無料です。テキスト生成、画像生成、音声合成などのタスクを実行するためにモデルを呼び出すと、モデルの推論 (呼び出し) 料金が発生します。 請求書の表示: [請求明細] および [コスト分析] ページに移動します。 統計の表示: モデル観測 (シンガポールまたは北京) ページに移動します。 | ||||||||||||||||||||||||
課金対象 | |||||||||||||||||||||||||
モデルの推論 (呼び出し) | 課金概要と無料クォータモデル呼び出しの価格については、モデルをご参照ください。1 分あたりのリクエスト数 (RPM) や 1 分あたりのトークン数 (TPM) などの制限については、レート制限をご参照ください。 説明 無料クォータはシンガポールリージョンでのみ利用可能です。無料クォータの取得方法と残り無料クォータの表示方法の詳細については、新規ユーザー無料クォータをご参照ください。 サブスクリプション (節約プラン)1 つ以上の節約プランを購入して、無料クォータを使い切った後に発生する推論料金を相殺できます。節約プランを使い切ると、システムはアカウント残高から料金の引き落としを開始します。 大規模言語モデル
Wan モデル
バッチ割引 (シンガポールリージョンのみ)バッチ推論 (バッチ API) サービスは、リアルタイム呼び出しの 50% のコストで大規模なデータセットを非同期に処理します。 コンソールまたは API を介してファイルを送信し、バッチタスクを作成できます。システムはオフピーク時にデータを処理し、タスクが完了するか最大待機時間に達したときに結果を返します。 サポート対象モデルテキスト生成モデル:qwen-max、qwen-plus、qwen-turbo 制限事項バッチ推論は、サブスクリプション(節約プラン)、無料クォータ、または Context Cache などのサービスや割引をサポートしていません。 コンテキストキャッシュ割引暗黙的キャッシュと明示的キャッシュが含まれます:
| ||||||||||||||||||||||||
よくある質問 | 全般支払い方法またはアカウントへのチャージ方法モデル呼び出し料金は自動的に引き落とされます。請求書は 1 時間ごとに生成されます。詳細については、支払い方法の概要をご参照ください。 サブスクリプション方法: モデルの推論 (呼び出し):LLM 推論節約プランの購入はこちら。 サービスの更新方法2024 年 3 月 15 日以降、Model Studio は商用サービスをアップグレードしました。すべてのサブスクリプションサービスは従量課金サービスに変更されました。そのため、手動でサービスを更新する必要はありません。従量課金方法が自動的に使用されます。 課金を停止する方法トークンの計算方法トークンは、モデルがテキストを表すために使用する基本単位です。文字や単語と考えることができます。
LLM によっては、トークンをチャンク化する方法が異なる場合があります。SDK を使用して、ローカルマシン上の Qwen モデルによってチャンク化されたトークンデータを表示できます。 Qwen モデルによってチャンク化されたトークンデータを表示する: ローカルトークナイザーは、テキスト内のトークン数を推定するのに役立ちます。ただし、結果は参考用であり、サーバー側のカウントと完全に一致しない場合があります。Qwen トークナイザーの詳細については、トークナイザーリファレンスをご参照ください。 モデル呼び出しが失敗した場合の対処法対応するソリューションについては、エラーメッセージドキュメントをご参照ください。 課金ルールモデルを呼び出した後、無料クォータが減らないのはなぜですか? (シンガポールのみ)無料クォータデータは 1 時間ごとに更新されます。ピーク時には、最大 1 時間の遅延が発生する場合があります。そのため、モデル呼び出し完了から 1 時間後に残りクォータを表示する必要があります。 無料クォータを超えたトークンはどのように課金されますか? (シンガポールのみ)マルチターン対話はどのように課金されますか?マルチターン対話では、過去の対話の入出力は新しいターンの入力トークンとして課金されます。 モデルアプリケーションは課金されますか?アプリケーションの作成は無料です。ただし、Q&A ペアのためにアプリケーションを呼び出す場合、呼び出されたモデルに基づいてモデル呼び出し料金が請求されます。 LLM 推論節約プランが控除に使用されないのはなぜですか?無料クォータが使い果たされていない場合、請求書は生成されず、料金も発生しません。この場合、節約プランは控除に使用されません。節約プランは、無料クォータが使い果たされ、請求書が生成された後に控除に使用されます。 支払い遅延支払い遅延の影響は何ですか?アカウントに支払い遅延がある場合、無料クォータ (シンガポールのみ) やリソースプランがあってもモデル呼び出しを行うことはできません。チャージページに移動してアカウントにチャージできます。 API 呼び出しエラー:サービス有効化または支払い遅延の問題を迅速に解決する方法1. サービスが有効化されていない Alibaba Cloud アカウントを使用してModel Studio コンソール (シンガポールまたは北京) に移動し、Model Studio のモデルサービスを有効化します。
2. アカウント残高不足
3. 繰り返しのエラーを防ぐための支出アラートの設定
請求書モデル推論の実行後、なぜ [請求明細] ページで関連する請求が見つからないのですか? 考えられる理由は次のとおりです:
すべての Model Studio サービスのコストを表示する方法コスト分析ページで、[コストタイプ] を [税引き前金額] に、[時間単位] を [月] に設定し、期間を選択して、[製品名] を [Alibaba Cloud Model Studio] に設定します。これにより、選択した期間内の Model Studio のコストを表示できます。
モデル 推論 サービスのコストを表示する方法コスト分析 ページで、[コストタイプ] を [税引前金額] に、[時間の粒度] を [月] に設定し、期間を選択して、[製品詳細] を [Model Studio 基盤モデルの推論] に設定すると、選択した期間内のモデル推論の合計コストを表示できます。
特定のモデルの 推論コストを表示する方法qwen-max を例に説明します。[請求明細] ページで、[請求月] を選択します。[商品名] を [Model Studio 基盤モデル推論] に設定し、[検索] をクリックします。 [インスタンス ID] 列で、qwen-max に関連するすべてのインスタンスを検索し、これらのインスタンスの税抜き額を合計して、選択した課金サイクルにおける qwen-max モデルの合計推論料金を算出します。
詳細な請求書で消費されたトークン数をエクスポートして表示する方法請求詳細ページで、統計項目を課金項目に設定し、請求書をエクスポートします。請求書でトークンの使用状況を表示できます。
モデルの詳細な請求書を照合する方法2024 年 9 月 7 日以降に生成されたモデルの推論、デプロイ、トレーニングの請求書は、ApiKeyID、ワークスペース ID、モデル名、入出力タイプ、呼び出しチャネル、およびインスタンスのタグに基づいて照合できます。 [利用明細] ページで、[請求月] を選択します。[商品名] を [Model Studio 基盤モデル推論] に設定し、[検索] をクリックします。検索結果をローカルマシンにダウンロードし、[インスタンス ID] 列の内容に基づいて請求を照合します。
完全なインスタンス ID (例: 完全なインスタンス タグ (例: Model Studio API キー管理ページに移動し、ApiKeyID に対応する API キーを確認して、API キーに基づいて請求書を照合します。 ワークスペース管理 (シンガポールまたは北京) ページに移動し、ワークスペース ID に対応するワークスペースを確認して、ワークスペースに基づいて請求書を照合します。 呼び出しチャンネルには app、bmp、および assistant-api が含まれます。 app は、モデルがアプリケーションを介して呼び出されることを示します。 bmp は、モデルが Playground (シンガポール または 北京) を介して呼び出されることを示します。 assistant-api は、モデルがアシスタント API を介して呼び出されることを示します。
従量課金の請求書はどのように決済されますか?従量課金制のクラウドリソースの請求は、リアルタイム決済では[ありません]。[代わりに]、システムはまず、アカウントの利用可能なクレジットから、消費済みで未決済の金額を凍結します。翌月の初めに、最終的な月次請求書が発行された後、前月の請求額が実際に引き落とされます。 コスト管理高額利用アラートの設定方法費用とコストセンターで[月次支出アラート] を設定できます。
モデル呼び出しの使用量を制限する方法
| ||||||||||||||||||||||||
料金概要 | Alibaba Cloud Model Studio の有効化は無料です。テキスト生成、画像生成、音声合成などのタスクを実行するためにモデルを呼び出すと、モデルの推論 (呼び出し) 料金が発生します。 請求書の表示: [請求明細] および [コスト分析] ページに移動します。 統計の表示: モデル観測 (シンガポールまたは北京) ページに移動します。 |
課金対象 | |
モデルの推論 (呼び出し) | サブスクリプション (節約プラン)バッチ割引 (シンガポールリージョンのみ)コンテキストキャッシュ割引 |
よくある質問 | 全般支払い方法またはアカウントへのチャージ方法サービスの更新方法課金を停止する方法呼び出し回数と消費トークン数の表示方法トークンの計算方法モデル呼び出しが失敗した場合の対処法課金ルールモデルを呼び出した後、無料クォータが減らないのはなぜですか? (シンガポールのみ)無料クォータを超えたトークンはどのように課金されますか? (シンガポールのみ)マルチターン対話はどのように課金されますか?モデルアプリケーションは課金されますか?LLM 推論節約プランが控除に使用されないのはなぜですか?支払い遅延支払い遅延の影響は何ですか?API 呼び出しエラー:サービス有効化または支払い遅延の問題を迅速に解決する方法請求書すべての Model Studio サービスのコストを表示する方法モデル 推論 サービスのコストを表示する方法特定のモデルの 推論コストを表示する方法詳細な請求書で消費されたトークン数をエクスポートして表示する方法モデルの詳細な請求書を照合する方法従量課金の請求書はどのように決済されますか?コスト管理高額利用アラートの設定方法モデル呼び出しの使用量を制限する方法 |








