Alibaba Cloud Model Studio は、Qwen シリーズおよび主要なサードパーティ製 LLM を、公式の Qwen API および OpenAI 互換 API の両方と統合しています。そのモデルサービスは、テキスト、イメージ、音声、および動画など、複数のモダリティに対応しており、コード生成、翻訳、データマイニング、意図認識など、さまざまなシナリオをサポートします。基盤となるインフラストラクチャの管理を必要とせず、モデル機能をオンデマンドで利用できるため、技術的な運用・保守(O&M)負荷を軽減できます。
わずか数行のコードで LLM とチャットし、コンテンツ作成や要約生成などのタスクを実行できます。 Model Studio は OpenAI API 標準と互換性があります。既存の OpenAI コードを Model Studio に移行するには、API キー、ベース URL、モデル名を調整するだけです。 |
モデルサービス
Model Studio は、すぐに利用可能なモデルサービスを提供します。独自の Qwen モデルおよび DeepSeek およびKimiなどのサードパーティモデルを直接呼び出すことができます。これらのモデルをデプロイまたはメンテナンスすることなく利用できます。詳細については、「モデル一覧」をご参照ください。
Qwen フラッグシップモデル:
Qwen-Max:Qwen シリーズで最も高性能なモデルで、複雑なマルチステップのタスクの処理に適しています。
Qwen-Plus: パフォーマンス、速度、コストのバランスが取れており、汎用的なシナリオに適しています。
Qwen-Flash:コスト効率が高く、低レイテンシーで、高速な応答を必要とする単純なタスクに適しています。
Qwen-Coder:ツール呼び出しおよび環境とのインタラクションに優れた能力を発揮し、コード生成およびコード理解に特化しています。
マルチモーダルカバレッジ:テキスト生成、視覚的理解、画像生成、動画生成、音声認識と合成、埋め込みなど、さまざまな機能が含まれます。
ドメイン固有モデル:長文ドキュメント処理、翻訳、データマイニング、意図認識、ロールプレイング、詳細な調査など、特定の業界やタスク向けのさまざまなドメインモデルを提供します。
課金
Model Studio の有効化は無料です。 モデルの呼び出し時に課金されます。 詳細については、「課金項目」および「モデルリスト」をご参照ください。
新規ユーザー向けの無料クォータ
Model Studioは、新規ユーザーに、モデル呼び出しを試すためのシンガポールリージョン専用の無料クォータを提供します。クォータが使い切られると、課金は自動的に従量課金方式に切り替わります。予期しない課金を回避するには、「超過課金の防止」機能を有効化できます。クォータが使い切られると、サービスは自動的に停止します。「新規ユーザー向け無料クォータ」をご参照ください。
支払い方法
モデルの呼び出しは、1 時間ごとに自動的に課金されます。サポートされている支払い方法については、「支払い方法の概要」をご参照ください。
請求と使用状況の表示
呼び出し統計: モデルの呼び出しが完了してから約 1 時間後、モデル観測 (シンガポール)、モデル観測 (バージニア)、または モデル観測 (北京) ページに移動します。クエリ条件を設定し、対象モデルの [操作] 列で [モニター] をクリックします。すると、呼び出しボリューム、トークン消費量、成功率などのモデル統計を表示できます。「モデルのモニタリング」をご参照ください。
Model Studio の開始方法
モデルをオンラインで試す: Playground (シンガポール)、Playground (バージニア)、または Playground (北京)
よくある質問
Q:私のデータは安全ですか? Model Studio は私のデータをトレーニングに使用しますか?
A:いいえ。Alibaba Cloud はデータプライバシーを厳格に保護しており、お客様のデータをモデルのトレーニングに使用することはありません。アプリケーションの構築やモデルのトレーニング時に送信するデータは、データのセキュリティを確保するために暗号化されます。詳細については、「プライバシーに関するお知らせ」をご参照ください。
Q: シンガポール、米国 (バージニア)、および中国 (北京) のリージョンにはどのような違いがありますか?
A: Alibaba Cloud Model Studio は、[国際版(シンガポール)]、 [米国(バージニア)]、および [中国(北京)] リージョンでモデルサービスを提供します。近隣のリージョンからモデルを呼び出すと、ネットワーク遅延が短縮されます。サービスエンドポイント(エンドポイント/ベースURL)および API キーはリージョン固有であり、相互に交換できません。サポートされるモデル、プラットフォーム機能、および価格もリージョンによって異なります。詳しくは、「モデル一覧」をご参照ください。
Q:自動支払いを回避するにはどうすればよいですか?
A:Model Studio は従量課金モデルを使用しており、「自動支払い」のスイッチはありません。課金を回避するには、次の対策を講じることができます。
API キーの削除
次のページに移動し、すべての API キーを削除します。[API-KEY (Singapore)]、[API-KEY (Virginia)]、または [API-KEY (Beijing)]。削除後、API を介して Model Studio のモデルを呼び出せなくなり、これにより追加の課金が発生しなくなります。
すべてのモデル呼び出しアクティビティの停止
アプリケーションでのモデル呼び出しを停止します。
エージェントやワークフローなどのアプリケーションからの呼び出しを停止します。
定期タスクやバックグラウンドプロセスを確認し、停止します。
課金は実際の呼び出しによってトリガーされます。すべての呼び出しアクティビティが停止していることを確認してください。
「超過料金防止」機能の有効化 (新規ユーザーのみ)
サポートされているモデルの製品ページで、このスイッチをオンにします。無料クォータが使い果たされると、サービスは自動的に停止し、エラーコード `AllocationQuota.FreeTierOnly` を返して課金を防ぎます。
注: この機能は、シンガポールリージョンのモデルにのみ適用され、無料クォータ期間中にのみ有効です。
コスト監視とアラートの設定
[請求明細]を表示します。
呼び出し統計を表示するには、Model Observation(シンガポール)、Model Observation(バージニア)、またはModel Observation(北京)にアクセスします。これらの統計は、各呼び出しの約1時間後に更新されます。
「高額課金アラート」を設定します。指定されたプロダクトの1日あたりの課金額がしきい値を超えたら、システムは毎日のショートメッセージによる通知を送信し、迅速な対応が可能になります。
これらの対策を講じることで、使用コストを効果的に管理できます。
Q:Qwen3 または DeepSeek モデルはどのように使用しますか?
A:
オンラインで試す:[モデル (シンガポール)]、[モデル (バージニア)]、または[モデル (北京)] ページに移動し、モデルをクリックして試用します。なお、DeepSeek は中国 (北京) リージョンでのみサポートされています。
API 経由でモデルを呼び出す:手順については、「Qwen への最初の API 呼び出しを行う」をご参照ください。サポートされているモデルのリストについては、「モデルリスト」をご参照ください。
開発者ツール (Claude Code など) を介してモデルを呼び出す:「クライアントと開発者ツール」をご参照ください。