Alibaba Cloud Model Studio は、フルマネージドサービスであり、Qwen シリーズ全モデルおよびその他の主要な大規模言語モデル(LLM)へのアクセスを提供します。公式の Qwen API および OpenAI 互換 API の両方をサポートしています。テキスト、画像、音声/動画を含む多様なマルチモーダル機能を活用し、コード生成、翻訳、データマイニング、意図理解などのユースケースに対応できます。基盤となるインフラストラクチャの管理を必要とせず、オンデマンドでこれらのモデルを利用できるため、運用オーバーヘッドを削減できます。
|
わずか数行のコードで LLM とチャットを行い、コンテンツ生成や要約作成が可能です。 Alibaba Cloud Model Studio は OpenAI API と互換性があります。既存の OpenAI アプリケーションを移行するには、API キー、ベース URL、およびモデル名を変更するだけで済みます。
|
モデルサービス
Alibaba Cloud Model Studio では、すぐに利用可能なモデルサービスを提供しており、独自の Qwen 大規模言語モデル(LLM)シリーズ全体および DeepSeek および Kimiなどのサードパーティ製モデルに、デプロイや運用の管理を必要とせずに直接アクセスできます。完全なモデル一覧については、「モデル一覧」をご参照ください。
-
Qwen の主力モデル:
-
Qwen-Max:Qwen シリーズ中最も強力なモデルで、複雑かつ複数ステップにわたるタスクに最適です。
-
Qwen-Plus:パフォーマンス、速度、コストのバランスに優れたモデルであり、ほとんどのシナリオにおいて推奨される選択肢です。
最新の Qwen3.5-Plus シリーズは、言語理解、論理的推論、コード生成、エージェントタスク、画像理解、動画分析など、幅広いタスクで優れた性能を発揮します。プロジェクトへの採用を強く推奨します。
-
Qwen-Flash:シンプルなタスクに対して高速な応答を実現する、コスト効率に優れ低レイテンシのモデルです。
-
Qwen-Coder:コード生成および理解のためのツール呼び出しおよび環境とのインタラクションに特化したモデルです。
-
-
マルチモーダル機能: テキスト生成、視覚理解、イメージ生成、ビデオ生成、音声認識および合成、および埋め込みベクターを含みます。
-
ドメイン固有のモデル: 特定の業界やタスク向けのモデルを提供します。例として、長文処理、翻訳、データマイニング、意図理解、ロールプレイ、および深さのある研究があります。
課金
Alibaba Cloud Model Studio の有効化は無料です。ただし、モデルの呼び出しを行うと課金が発生します。詳細については、「課金対象項目」および「モデル一覧」をご参照ください。
新規ユーザー向け無料クォータ
新規ユーザーには、モデル呼び出しのテスト用として、シンガポールリージョンで限定的に提供される無料クォータが付与されます。無料クォータが消費されると、従量課金方式で課金が開始されます。予期しない課金を防ぐために、「無料クォータのみ有効化」機能を有効化することで、クォータが消費された時点でサービスを自動的に停止できます。詳細については、「新規ユーザー向け無料クォータ」をご参照ください。
支払方法
モデル呼び出しは、自動的に時間単位で課金されます。対応している支払方法については、「支払方法」をご参照ください。
請求書および使用状況の確認
-
呼び出し統計:モデル呼び出し後、およそ1 時間経過すると、「Alibaba Cloud Model Studio コンソールにアクセスできます。右上隅で対象のリージョンを選択し、「モデルモニタリング」ページに移動します。クエリ条件を設定し、対象モデルの「Actions」列の「監視」をクリックします。呼び出し回数、トークン消費量、成功率などの統計情報を確認できます。詳細については、「モデルモニタリング」をご参照ください。
-
コーディングプランの使用状況:コーディングプランをご契約中の場合、「コーディングプランページ」でリクエスト使用状況をご確認いただけます。コーディングプランは、月額固定料金のサブスクリプションサービスであり、AI コーディングツールで使用可能な月間リクエストクォータを提供します。詳細については、「コーディングプランの概要」をご参照ください。
はじめに
-
オンラインでモデルを試す:
-
Alibaba Cloud Model Studio コンソールにアクセスし、右上隅でご利用のリージョンを選択します。
-
プレイグラウンドページに移動し、試したいモデルを選択します。
-
-
最初の API 呼び出しを行う:Qwen API への最初の呼び出し