各モデルの無料クォータを受けるには、シンガポールリージョンで Model Studio を有効化します。
無料クォータは Singapore リージョンのモデルでのみ利用可能です。その他のリージョンでは無料クォータは提供されていません。
ルール
有効期間
無料クォータは、有効化またはモデル承認から 30~90 日間有効です。有効期限切れまたはクォータを使い切った後も推論を継続する場合、課金が発生します。
2025 年 9 月 8 日 3:00 UTC 以降、初回有効化時の有効期間は 90 日に調整されます。この日付以前にサービスを有効化したユーザーには影響ありません。詳細については、「新規ユーザー向け無料クォータの有効期間変更について」をご参照ください。
適用範囲
無料クォータはリアルタイム推論のコストのみ相殺します。以下の料金は相殺されません。
カスタムモデル(ファインチューニングおよびデプロイ済みモデル)
注意事項
無料クォータはアカウントとすべての RAM ユーザー間で共有されます。
例:qwen-max の合計クォータは 1,000,000 トークンです。アカウントが 100,000 トークンを使用し、RAM ユーザーが 200,000 トークンを使用した場合、残りのクォータは 700,000 トークンです。
無料クォータの取得方法
Model Studio コンソール - シンガポールリージョン にアクセスします。利用規約に同意して有効化すると、無料クォータが付与されます。無料クォータはシンガポールリージョンでのみ利用可能です。その他のリージョンでは無料クォータは提供されていません。
利用規約が表示されない場合は、すでに有効化済みで無料クォータを受領済みです。
残りのクォータの確認方法
残りの無料クォータは以下のいずれかの方法で確認できます。
方法 1:使用量ページ
モデル使用量 ページで、無料クレジット タブをクリックして、すべてのモデルの残りクォータと有効期間を確認します。
方法 2:モデルページ
Model Studio を有効化した後、コンソールのモデルページ (シンガポール) にアクセスします。対象のモデルをクリックして、製品ページで残りのクォータを確認します。
24,098/1,000,000:合計 1,000,000 トークンのうち、24,098 トークンが残っています。

クォータの使用方法
リアルタイム呼び出し (シンガポールリージョン) は自動的に無料クォータを使用します。詳細については、「クイックスタート」をご参照ください。
超過課金を防止する方法
デフォルトでは、クォータを使い切った後も呼び出しが継続され、課金が発生します。無料クォータのみ を有効にすると、クォータを使い切った時点で呼び出しがブロックされ、エラー AllocationQuota.FreeTierOnly が返されます。
有効化方法
方法 1:使用量ページ
単一モデルの場合:
コンソールの モデル使用量 ページで、無料クレジット タブをクリックします。
リストから対象のモデルを見つけ、[操作] 列にある 無料クレジットが使い切られると停止します スイッチをオンにします。(このスイッチは、まだ無料クォータが残っているモデルでのみ表示されます。)
一括操作の場合:
コンソールの モデル使用量 ページで、無料クレジット タブをクリックします。
一括操作の無料クォータが使い切られたら即時停止 をクリックし、ドロップダウンメニューから 一括有効化 を選択します。
対象のモデルにチェックを入れ、一括有効化 をクリックします。有効化されていないすべての対象モデルに対してこの機能を有効にするには、すべてのモデルをワンクリックで有効化 をクリックします。
確認ダイアログボックスで、Enable Free Quota Only をクリックします。

方法 2:モデルページで有効化
Qwen3-Coder-Plus を例に説明します。Qwen3-Coder-Plus 製品ページ(シンガポールリージョン) にアクセスし、無料クレジットが使い切られると停止します スイッチをオンにします。

スイッチが表示されない場合は、クォータが使い切られている、有効期限が切れている、またはそのモデルが無料クォータを提供していない可能性があります。
無効化方法
この機能はデフォルトで無効になっています。有効にすると、コンソールに[クォータ枯渇]と表示された場合にのみ、無料クレジットが使い切られると停止しますを無効にできます。
コンソールのクォータは 1 分ごとに更新されます。最新の情報を確認するには、手動でページをリフレッシュしてください。
よくある質問
無料クォータを使い切った際に通知はありますか?
はい。残りの無料クォータが 20% になったとき、または完全に使い切ったときにシステムから通知が送信されます。サイト内メッセージとメールで通知を受け取ります。
無料クォータを使い切るとどうなりますか?
無料クォータのみ が有効になっていない場合、呼び出しは継続され、超過分のトークンは「モデル」の料金体系に基づいて課金されます。課金額はアカウントから差し引かれ、未払い状態になる可能性があります。
未払い状態になると、残りのクォータがあってもすべての呼び出しがブロックされます。
モデルを呼び出す前に、クォータを確認し、予算管理
無料クォータの消費レコードや請求書を確認するにはどうすればよいですか?
消費レコードはモデル呼び出しが終了してから数分後に生成されます。確認手順は以下のとおりです。
請求明細 ページで課金月を選択します。次に、製品名 を Alibaba Cloud Model Studio に設定し、検索 をクリックします。
請求明細リストの右上隅にある
アイコンをクリックします。使用量の詳細 を見つけ、課金相殺使用量 を確認し、OK をクリックします。明細タイプ が 無料クォータ の請求項目を探します。課金相殺使用量 は、無料クォータによって相殺された使用量を示します。
なぜ課金されているのですか?
考えられる原因:
無料クォータのないモデルを使用しました(例:qwen-max と qwen-max-latest はそれぞれ別のクォータを持ちます)。
無料クォータは OpenAI 互換:バッチ(ファイル入力) の料金をカバーしません。
コンソールの無料クォータデータは 1 分ごとに更新されます。最新のデータを確認するには、手動でページをリフレッシュしてください。リフレッシュしないと、クォータがすでに使い切られているにもかかわらず、コンソール上ではまだ残りがあるように表示される場合があります。
課金内容を確認するには、「どのモデルが課金対象となったか確認する方法」および「モデル呼び出しレコードを確認する方法」をご参照ください。
どのモデルが課金対象となったか確認する方法
モデルを呼び出してから数分後、請求明細 ページで、課金月 を選択し、商品名 を Model Studio Foundation Model Inference に設定し、検索 をクリックします。インスタンス ID 列で課金対象のモデルを確認できます。

モデル呼び出しレコードを確認する方法
モデルを呼び出してから 1 時間後、モニタリング (シンガポール または 北京) ページに移動します。 時間範囲やワークスペースなどのクエリ条件を設定します。 次に、[モデル] エリアで対象のモデルを見つけ、[アクション] 列にある [モニター] をクリックしてモデルの呼び出し統計を表示します。 詳細については、「モニタリングドキュメント」をご参照ください。
データは 1 時間ごとに更新されます。ピーク時などは 1 時間程度の遅延が発生する場合があります。

予期しない課金を回避するにはどうすればよいですか?
クォータを使い切った後、課金額は残高から差し引かれます。予期しない課金を抑えるには、以下の対応をお勧めします。
API キー(シンガポール) または API キー(北京) ページにアクセスし、すべての API キーを削除して、これ以上の呼び出しと課金を防止します。

支出制限アラート を設定して、月間支出がしきい値を超えた際にメール通知を受け取ります。

残りのクォータがあるのに呼び出しが失敗するのはなぜですか?
未払いの残高 があると、残りのクォータがあってもすべての呼び出しがブロックされます。
無料クォータとその有効期間が表示されないのはなぜですか?
クォータ列に 無料クォータはありません。 と表示されている、または 無料クレジット エリアが表示されていない場合は、クォータの有効期限が切れている可能性があります。
北京リージョンでは無料クォータは提供されていません。