Alibaba Cloud Model Studio (シンガポールリージョン) を初めて有効化すると、モデルごとに無料クォータが自動的に付与されます。
無料クォータは、[インターナショナルエディション] (シンガポール) モデルでのみ利用可能です。[中国本土エディション] (北京) モデルには無料クォータはありません。
ルール
有効期間
新規ユーザー向けの無料クォータは、通常、Model Studio をアクティベートした日、またはモデルリクエストが承認された日から 30 日から 90 日間有効です。有効期間が終了するか、無料クォータを使い切ると、モデル推論サービスを継続して使用する際に料金が発生します。
2025年9月8日 3:00 (UTC) より、初めて Model Studio を有効化する新規ユーザーを対象に、無料クォータの有効期間が 90 日間に調整されます。この日付より前にサービスを有効化したユーザーは影響を受けません。詳細については、「新規ユーザー無料クォータの有効期間の変更」をご参照ください。
適用範囲
新規ユーザー向けの無料クォータは、リアルタイムのモデル推論 (呼び出し) の料金のみが対象です。バッチ呼び出し、コンテキストキャッシュ の料金は対象外です。
注意事項
Alibaba Cloud アカウントとその RAM ユーザーは無料クォータを共有します。
例えば、qwen-max の無料クォータの合計が 1,000,000 トークンであるとします。Alibaba Cloud アカウントが 100,000 トークンを使用し、RAM ユーザーが 200,000 トークンを使用した場合、qwen-max の残りの無料クォータは 700,000 トークンになります。
クォータの取得
Model Studio - シンガポールリージョンに移動します。利用規約を読んで同意すると、Model Studio が自動的に有効になり、無料の推論クォータを受け取ります(無料クォータはシンガポールリージョンでのみ利用可能です。北京リージョンでは無料クォータは提供されません)。
利用規約が表示されない場合は、すでに Model Studio をアクティベートし、無料クォータを受け取っていることを示します。
残りのクォータの表示
Alibaba Cloud Model Studio をアクティベートした後、コンソールのモデルリストページ (シンガポール) に移動します。対象のモデルをクリックして、その製品ページで残りのクォータを表示します。
次の図に示すように、24,098/1,000,000 は、合計 1,000,000 トークンのうち 24,098 トークンが残っていることを示します。

クォータの使用
(シンガポールリージョン) 内のモデルに対するリアルタイム呼び出しでは、無料クォータが自動的に使用されます。詳細については、「Model Studio の使用を開始する」をご参照ください。
無料クォータのみ
デフォルトでは、無料クォータを使い切った後の使用量に対して課金されます。[無料クォータのみ] 機能を有効にすると、クォータを使い切った後は呼び出しができなくなり、`AllocationQuota.FreeTierOnly` エラーが返されます。この機能により、追加料金の発生を防ぐことができます。
有効化の方法
Qwen3-Coder-Plus を例として、Qwen3-Coder-Plus 詳細ページ (シンガポールリージョン) に移動し、[無料クォータのみ] をオンにします。

モデルにスイッチが表示されない場合、そのモデルの無料クォータが使い果たされたか、有効期限が切れているか、またはモデルが無料クォータを提供していないことを示します。
無効化の方法
この機能は、デフォルトで無効になっています。[無料クォータのみ] を有効にした場合、コンソールに 無料クォータを使い切った 旨が表示された後にのみ、無効にできます。
コンソールに表示される無料クォータは 1 時間ごとに更新され、リアルタイムのデータではありません。
よくある質問
無料クォータを使い切ったときに通知はありますか?
現在、通知の仕組みはありません。
無料クォータを使い切るとどうなりますか?
無料クータのみ機能を有効にしていない場合、無料クォータがなくなっても進行中のモデル呼び出しは完了し、中断されません。無料クォータを超えたトークンは、モデルで指定された入出力コストに基づいて課金されます。発生した料金は、Alibaba Cloud アカウントから従量課金制で自動的に引き落とされます。これにより、アカウントで支払い遅延が発生する可能性があります。
アカウントで支払い遅延が発生している場合、他のモデルに無料クォータが残っていても、そのモデルを呼び出すことはできません。
モデルを呼び出す前に、モデルの無料クォータを確認し、予算管理。
なぜ課金されているのですか?
考えられる理由は次のとおりです:
無料クォータのないモデルを使用した。例えば、qwen-max と qwen-max-latest モデルの無料クォータは共有されません。
無料クォータは、OpenAI 互換バッチ呼び出しの料金をカバーしていません。
コンソールの無料クォータデータは 1 時間ごとに更新されます。そのため、実際には使い果たされているにもかかわらず、コンソールに無料クォータが残っているように表示され、課金が発生する場合があります。後でもう一度、最新の無料クォータの状況を確認してください。
請求詳細を確認するには、「どのモデルで料金が発生したかを確認する方法は?」および「モデルの呼び出しレコードを表示する方法は?」をご参照ください。
どのモデルで料金が発生したかを確認する方法は?
モデルを呼び出してから 1 時間後、[請求明細] ページで [請求月] を選択します。 次に、[商品名] を [Model Studio Foundation Model Inference] に設定し、[検索] をクリックします。 [インスタンス ID] 列で、費用が発生したモデルを確認できます。

モデルの呼び出しレコードを表示する方法は?
モデルを呼び出してから1 時間後、モデル観察 (シンガポールまたは北京) ページに移動します。 時間範囲やワークスペースなどのクエリ条件を設定します。 次に、[モデル] エリアで対象のモデルを見つけ、[アクション] 列の [モニター] をクリックしてモデルの呼び出し統計を表示します。 詳細については、「モデル観察 ドキュメント」をご参照ください。
データは 1 時間ごとに更新されます。ピーク時には、時間単位の遅延が発生する場合があります。

課金を回避する方法は?
無料クォータを使い切った後、料金は Alibaba Cloud アカウントの残高から自動的に引き落とされます。以下の方法で課金のリスクを管理できます:
API キー (シンガポールまたは北京)を削除します。API キーを削除すると、Model Studio で API を使用してモデルを呼び出すことができなくなるため、それ以降のモデル呼び出し料金は発生しません。

利用限度額アラートを設定します。当月の利用額がアラートのしきい値を超えた場合、通知メールが届きます。

クォータが残っているのに、なぜ呼び出しに失敗したのですか?
お使いの Alibaba Cloud アカウントに支払い遅延があるかどうかを確認してください。アカウントに支払い遅延がある場合、無料クォータが残っていても、モデルを呼び出すことはできません。
無料クォータとその有効期間が表示されないのはなぜですか?
[無料クォータ] 列に [無料クォータなし] と表示されるか、[無料クォータ] エリアが表示されない場合は、アカウント内のモデルの無料クォータが期限切れになったことを示します。
北京リージョンには無料クォータはありません。
