Alibaba Cloud Model Studio は、Qwen シリーズおよび主流のサードパーティ製 LLM を統合しており、公式の Qwen API と OpenAI 互換 API の両方を提供します。そのモデルサービスは、テキスト、イメージ、音声、動画など複数のモダリティをカバーし、コード生成、翻訳、データマイニング、意図認識といったさまざまなシナリオをサポートします。お客様は、基盤となるインフラストラクチャを管理することなく、オンデマンドでモデルの機能を利用でき、技術的な O&M の負担を軽減できます。
数行のコードだけで LLM とチャットし、コンテンツ作成や要約生成などのタスクを実行できます。 Model Studio は OpenAI API 標準と互換性があります。既存の OpenAI コードを Model Studio に移行するには、API キー、ベース URL、モデル名を調整するだけです。 |
モデルサービス
Model Studio は、すぐに使えるモデルサービスを提供します。独自の Qwen モデルや、 DeepSeek や Kimi などのサードパーティモデルを、デプロイやメンテナンスを行うことなく直接呼び出すことができます。モデルリストをご参照ください。
Qwen フラッグシップモデル:
Qwen-Max: Qwen シリーズで最高性能のモデルであり、複雑で複数ステップのタスクの処理に適しています。
Qwen-Plus: パフォーマンス、速度、コストのバランスに優れ、汎用的なシナリオに適した選択肢です。
Qwen-Flash: コスト効率と低レイテンシーに優れ、高速な応答を要する単純なタスクに適しています。
Qwen-Coder: ツール呼び出しと環境インタラクションに優れており、コード生成と理解に特化しています。
マルチモーダルカバレッジ:テキスト生成、視覚的理解、画像生成、動画生成、音声認識と合成、埋め込みなど、さまざまな機能が含まれます。
ドメイン特化モデル:長文ドキュメント処理、翻訳、データマイニング、意図認識、ロールプレイング、詳細な調査など、特定の業界やタスク向けのさまざまなドメインモデルを提供します。
課金
Model Studio の有効化は無料です。モデルの呼び出しを行う際に料金が発生します。詳細については、「課金項目」および「モデルリスト」をご参照ください。
新規ユーザー向けの無料クォータ
Alibaba Cloud Model Studio は、新規ユーザーにモデルの呼び出しをお試しいただくために、およびシンガポールリージョンで専用の無料クォータを提供します。クォータを使い切ると、課金は自動的に従量課金方式に切り替わります。意図しない課金を避けるために、無料クォータのみ機能を有効にできます。クォータがなくなると、サービスは自動的に停止します。詳細については、「新規ユーザー向けの無料クォータ」をご参照ください。
支払方法
モデルの呼び出しは時間単位で自動的に課金されます。サポートされている支払方法については、「支払方法の概要」をご参照ください。
請求と使用状況の表示
呼び出し統計: モデルの呼び出しが完了してから約 1 時間後、モデル観測 (シンガポール)、モデル観測 (バージニア)、または モデル観測 (北京) ページに移動してクエリ条件を設定し、対象のモデルの [操作] 列にある [モニター] をクリックします。そうすると、呼び出しボリューム、トークン消費量、成功率など、モデルの統計を表示できます。詳細については、「モデルモニタリング」をご参照ください。
Alibaba Cloud Model Studio の利用開始
オンラインでモデルを試す: プレイグラウンド (シンガポール)、プレイグラウンド (バージニア)、またはプレイグラウンド (北京)
よくある質問
Q:データのセキュリティは確保されていますか?Model Studio が私のデータをトレーニングに使用することはありますか?
A:いいえ。Alibaba Cloud はデータプライバシーを厳格に保護しており、お客様のデータをモデルのトレーニングに使用することは決してありません。アプリケーションの構築やモデルのトレーニング時に送信するデータは、データセキュリティを確保するために暗号化されます。詳細については、「プライバシーポリシー」をご参照ください。
Q: シンガポール、米国 (バージニア)、中国 (北京) リージョンにはどのような違いがありますか?
A: Alibaba Cloud Model Studio は、シンガポール、米国 (バージニア)、および 中国 (北京) リージョンでモデルサービスを提供しています。近くのリージョンからモデルを呼び出すと、ネットワーク遅延が削減されます。サービスエンドポイント (Endpoint/Base URL) と API キーはリージョン固有であり、相互に交換することはできません。サポートされているモデル、プラットフォームの機能、価格もリージョンによって異なります。「モデルリスト」をご参照ください。
Q:自動支払いを回避するにはどうすればよいですか?
A:Model Studio は従量課金モデルを使用しており、「自動支払い」のスイッチはありません。料金を回避するには、次の対策を講じることができます。
API キーの削除
[API-KEY (シンガポール)]、[API-KEY (バージニア)]、または [API-KEY (北京)] ページに移動し、すべての API キーを削除します。削除後、API を介して Model Studio モデルを呼び出すことができなくなり、追加の課金が発生しなくなります。
すべてのモデル呼び出しアクティビティの停止
アプリケーションでのモデル呼び出しを停止します。
エージェントやワークフローなどのアプリケーションからの呼び出しを停止します。
定期タスクやバックグラウンドプロセスを確認して停止します。
料金は実際の呼び出しによってトリガーされます。すべての呼び出しアクティビティが停止していることを確認してください。
無料クォータを使い切ったら停止機能の有効化 (新規ユーザーのみ)
サポートされているモデルの製品ページで、このスイッチをオンにします。無料クォータがなくなると、サービスは自動的に停止し、エラーコード `AllocationQuota.FreeTierOnly` を返して課金を防ぎます。
注意: この機能の対象はシンガポールリージョンのモデルのみで、無料クォータ期間中のみ有効です。
コスト監視とアラートの設定
[利用明細]を表示します。
[モデル観測 (シンガポール)]、[モデル観測 (バージニア)]、または[モデル観測 (北京)]に移動すると、各呼び出しの約 1 時間後に更新される呼び出し統計を表示できます。
高額利用アラートを設定すると、指定されたプロダクトの日次請求がしきい値を超えた場合に、タイムリーに対応できるよう、システムが毎日ショートメッセージを送信します。
これらの措置を講じることで、利用コストを効果的にコントロールできます。
Q:Qwen3 や DeepSeek モデルを使用するにはどうすればよいですか?
A:
オンラインで試す: [モデル (シンガポール)]、[モデル (バージニア)]、または [モデル (北京)] ページに移動し、モデルをクリックして試すことができます。 なお、DeepSeek は中国 (北京) リージョンでのみサポートされています。
API を介してモデルを呼び出す:手順については、「Qwen への最初の API 呼び出しを行う」をご参照ください。サポートされているモデルのリストについては、「モデルリスト」をご参照ください。
開発者ツール (Claude Code など) を介してモデルを呼び出す:「クライアントと開発者ツール」をご参照ください。