デプロイメントモードは、モデル推論のコンピューティングリージョンと静的データが保存される場所を決定します。適切なデプロイメントモードを選択して、ネットワーク遅延を最適化し、データ処理が適用される地理的境界を確実に遵守するようにしてください。
デプロイメントモードの比較
デプロイメントモードは、利用可能な計算能力とモデル推論の実行リージョンを決定します。このリージョンは、静的データが保存される場所も決定します。現在、これら 2 つは事前にバインドされており、個別の構成はサポートされていません。
ネットワーク遅延を削減し、モデルの応答速度を向上させるには、プライマリユーザーまたはビジネスアプリケーションに近いリージョンに対応するデプロイメントモードを選択してください:
デプロイメントモード | バインドされたリージョン (データストレージ) | モデル推論のコンピューティングスコープ |
Global | 米国 (バージニア) | グローバル動的スケジューリング |
International | シンガポール | グローバル動的スケジューリング (中国本土を除く) |
United States | 米国 (バージニア) | 米国に限定 |
Mainland China | 中国 (北京) | 中国本土に限定 |
[Global] および [International] デプロイメントモードでは、お客様のビジネスにおける越境データ処理の合法性を確保する責任があります。これらのモードには越境コンピューティングが含まれます。クロスリージョン推論リクエストは、選択したリージョンのフロントエンドエンドポイントによって受信されます。モデル呼び出し中に生成されるプロンプト入力やモデル出力などの静的データは、一時的にのみ処理され、コンピュートノードが存在するリージョンに永続的に保存されることはありません。データは転送中に暗号化されます。
使用方法
モデルを使用する Global デプロイメントモード
これらのモデルを使用する前に、リクエストアドレス、API キー、およびモデル名を設定してください:
リクエストアドレス (ベース URL):グローバルデプロイメントモードは、米国 (バージニア) リージョンにバインドされています。ドメイン名として
dashscope-us.aliyuncs.comを使用します。以下はリクエストアドレスの例です。他の API については、対応するドキュメントをご参照ください:OpenAI Chat Completions API:
https://dashscope-us.aliyuncs.com/compatible-mode/v1DashScope:
https://dashscope-us.aliyuncs.com/api/v1
API キー:キー管理 (バージニア) ページに移動して取得します。
モデル名:モデルリスト を参照し、グローバルデプロイメントモードのモデルを選択してください。
使用Internationalデプロイメント モード モデル
これらのモデルを使用する前に、リクエストアドレス、API キー、およびモデル名を設定してください:
リクエストアドレス (ベース URL):インターナショナルデプロイメントモードは、シンガポールリージョンにバインドされています。ドメイン名として
dashscope-intl.aliyuncs.comを使用します。以下はリクエストアドレスの例です。他の API については、対応するドキュメントをご参照ください:OpenAI Chat Completions API:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1DashScope:
https://dashscope-intl.aliyuncs.com/api/v1
API キー:キー管理 (シンガポール) ページに移動して取得します。
モデル名:モデルリスト を参照し、インターナショナルデプロイメントモードのモデルを選択してください。
使用 United States デプロイメントモードでのモデル
これらのモデルを使用する前に、リクエストアドレス、API キー、およびモデル名を設定してください:
リクエストアドレス (ベース URL):米国デプロイメントモードは、米国 (バージニア) リージョンにバインドされています。ドメイン名として
dashscope-us.aliyuncs.comを使用します。以下はリクエストアドレスの例です。他の API については、対応するドキュメントをご参照ください:OpenAI Chat Completions API:
https://dashscope-us.aliyuncs.com/compatible-mode/v1DashScope:
https://dashscope-us.aliyuncs.com/api/v1
API キー:キー管理 (バージニア) ページに移動して取得します。
モデル名:モデルリスト を参照し、米国デプロイメントモードのモデル (
-usサフィックス付き) を選択してください。
使用 Mainland China デプロイメントモードのモデル
これらのモデルを使用する前に、リクエストアドレス、API キー、およびモデル名を設定してください:
リクエストアドレス (ベース URL):中国本土デプロイメントモードは、中国 (北京) リージョンにバインドされています。ドメイン名として
dashscope.aliyuncs.comを使用します。以下はリクエストアドレスの例です。他の API については、対応するドキュメントをご参照ください:OpenAI Chat Completions API:
https://dashscope.aliyuncs.com/compatible-mode/v1DashScope:
https://dashscope.aliyuncs.com/api/v1
API キー:キー管理 (北京) ページに移動して取得します。
モデル名:モデルリスト を参照し、中国本土デプロイメントモードのモデルを選択してください。
非同期タスク
画像生成や動画生成などの非同期タスクの場合、タスク作成時に使用したサービスドメイン名と API キーを、後続のすべての操作で同じように使用する必要があります。そうしない場合、エラーが発生します。
次の例は、グローバルデプロイメントモードで画像生成タスクを作成し、その結果をクエリする方法を示しています:
# タスクの作成 (グローバルデプロイメントモード、サービスドメイン名 dashscope-us.aliyuncs.com)
curl --location 'https://dashscope-us.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
"model": "wan2.6-t2i",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"text": "A flower shop with exquisite windows, beautiful wooden doors, and flowers."
}
]
}
]
},
"parameters": {
"n": 1
}
}'
# 応答例: {"output":{"task_id":"abc123..."},"request_id":"..."}
# タスクのクエリ (同じサービスドメイン名を使用する必要があります)
curl -X GET https://dashscope-us.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
# [エラー] 異なるサービスドメイン名でクエリするとエラーが発生します
curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"リージョン情報
リージョンは、Alibaba Cloud Model Studio サービスにアクセスするノードの物理的な場所です。リージョン ID は次のとおりです:
Singapore:
ap-southeast-1US (Virginia):
us-east-1China (Beijing):
cn-beijing
各リージョンでサポートされているプラットフォームの機能は次のとおりです:
セクション | 機能 | シンガポール | 米国 (バージニア) | 中国 (北京) |
使用 | リアルタイム推論 | |||
バッチ推論 | ||||
プレイグラウンド | ||||
管理 | モデルモニタリング | |||
モデルアラート | ||||
転送セキュリティ | ||||
権限管理 | ||||
最適化 | モデルファインチューニング |
参考情報
モデルリスト:各デプロイメントモードでサポートされているモデルとコンテキスト情報を表示します。
モデル呼び出しの課金:各デプロイメントモードの価格差を表示します。
レート制限:各デプロイメントモードの RPM および TPM 制限を表示します。
API キーと API ホストの取得:各デプロイメントモードの API キーを作成および管理します。