初めて Alibaba Cloud Model Studio (シンガポールリージョン) を有効化すると、各モデルの無料クォータが自動的に付与されます。
無料クォータは シンガポール リージョンのモデルでのみ利用可能です。他のリージョンには無料クォータはありません。
ルール
有効期間
新規ユーザー向けの無料クォータは、通常、Alibaba Cloud Model Studio を有効化した日、またはモデルリクエストが承認された日から 30 日から 90 日間有効です。有効期間が終了した後、または無料クォータを使い切った後にモデル推論サービスを継続して使用すると、料金 が発生します。
2025年9月8日 3:00 (UTC) 以降、初めて Alibaba Cloud Model Studio を有効化する新規ユーザー向けの無料クォータは 90 日間有効になります。この日付より前にサービスを有効化したユーザーは影響を受けません。詳細については、「新規ユーザー向けの無料クォータの有効期間の変更」をご参照ください。
適用範囲
新規ユーザー向けの無料クォータは、リアルタイムのモデル推論(呼び出し)の料金のみが対象です。このクォータは、バッチ呼び出し、コンテキストキャッシュの料金は対象外です。
注意事項
Alibaba Cloud アカウントとその RAM ユーザーは無料クォータを共有します。
たとえば、qwen-max の無料クォータの合計が 1,000,000 トークンの場合、Alibaba Cloud アカウントが 100,000 トークンを使用し、RAM ユーザーが 200,000 トークンを使用すると、qwen-max の残り無料クォータは 700,000 トークンになります。
無料クォータの取得
Alibaba Cloud Model Studio - シンガポールリージョンに移動します。 利用規約をお読みになり、同意すると、Alibaba Cloud Model Studio が自動的に有効化され、無料の推論クォータを受け取ります。 無料クォータはシンガポールリージョンでのみ利用できます。 他のリージョンには無料クォータはありません。
利用規約が表示されない場合は、すでに Alibaba Cloud Model Studio を有効化し、無料クォータを受け取っていることを示します。
残りクォータの確認
Alibaba Cloud Model Studio を有効化した後、コンソールのモデルリスト (シンガポール) ページに移動します。対象のモデルをクリックして、モデル詳細ページで残りクォータを確認します。
次の図に示すように、24,098/1,000,000 は、合計 1,000,000 トークンのうち 24,098 トークンが残っていることを示します。

クォータの使用
大規模言語モデル (LLM) へのリアルタイム呼び出し(シンガポールリージョン) では、無料クォータが自動的に使用されます。詳細については、「Alibaba Cloud Model Studio クイックスタート」をご参照ください。
無料クォータを使い切った場合の停止
デフォルトでは、無料クォータを使い切った後の使用量に対して課金されます。無料クォータのみ機能を有効にすると、クォータを使い切った後は呼び出しができなくなり、`AllocationQuota.FreeTierOnly` エラーが返されます。この機能により、追加料金の発生を防ぐことができます。
有効化の方法
たとえば、Qwen3-Coder-Plus 詳細ページ (シンガポールリージョン)で、[無料クォータのみ] スイッチをオンにします。

モデルにスイッチが表示されない場合、そのモデルの無料クォータが使い果たされたか、有効期限が切れているか、またはモデルが無料クォータを提供していないことを示します。
無効化の方法
この機能はデフォルトで無効になっています。[無料クォータのみ] 機能を有効にしている場合、コンソールで無料クォータが使い果たされたと表示された後にのみ無効にできます。
コンソールに表示される無料クォータは 1 時間ごとに更新され、リアルタイムのデータではありません。
よくある質問
無料クォータを使い切った際の通知はありますか?
現在、通知はサポートされていません。
無料クォータを使い切った場合はどうなりますか?
[無料クータのみ] 機能を有効にしていない場合、無料クォータを使い切っても進行中のモデル呼び出しは中断されず、完了します。無料クォータを超えたトークンは、[モデルリスト] に記載されている入出力コストに基づいて課金されます。発生した料金は、従量課金制で Alibaba Cloud アカウントから自動的に引き落とされます。これにより、アカウントで支払い遅延が発生する可能性があります。
アカウントで支払い遅延が発生している場合、他のモデルに無料クータが残っていても、それらを呼び出すことはできません。
モデルを呼び出す前に、モデルの無料クォータを確認し、予算管理。
なぜ課金されているのですか?
考えられる理由は次のとおりです:
無料クォータがないモデルを使用した。たとえば、qwen-max モデルと qwen-max-latest モデルの無料クォータは共有されません。
無料クォータは OpenAI 互換-バッチ 呼び出しの料金をカバーしていません。
コンソールの無料クォータデータは 1 時間ごとに更新されます。そのため、クォータがすでに使い果たされていてもコンソールには残りクォータが表示され、結果として料金が発生する場合があります。後でもう一度、最新の無料クォータ状況を確認できます。
請求詳細を確認するには、「どのモデルで料金が発生したかを確認する方法は?」および「モデルの呼び出しレコードを確認する方法は?」をご参照ください。
どのモデルで料金が発生したかを確認する方法は?
モデルの呼び出しから約 1 時間後、請求明細 ページに移動します。 [請求サイクル] を選択します。 次に、[製品詳細] を [Model Studio LLM Inference] に設定し、[検索] をクリックします。 [インスタンス ID] 列で、費用が発生したモデルを表示できます。

モデルの呼び出しレコードを確認する方法は?
モデルを呼び出してから 1 時間後に、モデルの監視 (シンガポールまたは北京) ページに移動します。 時間範囲やワークスペースなどのクエリ条件を設定します。 次に、[モデル] エリアで対象のモデルを見つけ、[アクション] 列の [モニター] をクリックしてモデルの呼び出し統計を表示します。 詳細については、「モデルの監視 ドキュメント」をご参照ください。
データは 1 時間ごとに更新されます。ピーク時には、1 時間レベルの遅延が発生する場合があります。

課金を回避する方法は?
無料クォータを使い切った後、料金は Alibaba Cloud アカウントの残高から自動的に引き落とされます。以下の方法で予期しない課金を防ぐことができます:
Alibaba Cloud Model Studio の [API-Key (シンガポール)] または [API-Key (北京)] ページに移動し、すべての API キーを削除します。API キーを削除すると、API を使用して Model Studio のモデルを呼び出すことができなくなり、追加の課金が発生しなくなります。

消費上限アラートを設定します。当月の消費額がアラートのしきい値を超えた場合、通知メールが送信されます。

クォータが残っているのに、呼び出しが失敗したのはなぜですか?
お使いのAlibaba Cloud アカウントに支払い遅延が発生しているかご確認ください。アカウントに支払い遅延がある場合、無料クォータが残っていても、モデルを呼び出すことはできません。
無料クォータとその有効期間が表示されないのはなぜですか?
[無料クォータ] 列に [無料クォータなし] と表示される場合、または [無料クォータ] エリアが表示されない場合は、アカウント内のモデルの無料クォータの有効期限が切れていることを示します。
北京リージョンには無料クォータはありません。
