Model Studio の設定として、以下の 2 つの主要な構成項目を選択します:
リージョン:モデルサービスへのアクセス先および静的データの保存先を定義します。
デプロイモード:推論処理の実行場所を定義します。
この 2 つの構成項目は独立していますが、事前定義された組み合わせのみを使用する必要があります。これらを組み合わせることで、レイテンシ、コスト、利用可能なモデル、およびデフォルトのレート制限に影響を与えます。選択するデプロイモードに関係なく、静的データ(入力および出力を含む)は常に選択したリージョンに保存されます。
ヒント:リージョンは「データの所在」を制御し、デプロイモードは「推論の実行場所」を制御します。パフォーマンス、コスト、コンプライアンス要件のバランスを取るために、両方を活用してください。
リージョンの選択
モデルサービスのリージョンとは、そのエンドポイントの物理的な所在地です。リージョンを選択する際は、以下の要素を検討してください:
アクセスレイテンシ:応答時間に最も大きな影響を与える要因は物理的な距離です。ネットワーク遅延を最小限に抑えるため、ご利用の環境およびエンドユーザーに地理的に近いリージョンを選択してください。
コンプライアンス要件:データの所在要件を満たすリージョンを選択してください。デプロイメントは、適用される現地法および規制に準拠している必要があります。
機能の可用性:利用可能な機能およびモデルはリージョンによって異なります。詳細については、「リージョン別の機能の可用性」および「利用可能なモデル一覧」をご参照ください。
現在サポートされているリージョン: シンガポール、米国 (バージニア)、中国 (北京)、中国 (香港)、ドイツ (フランクフルト)
すべての静的データは、データの所在要件を満たすために、選択したリージョンに保存されます。
デプロイモード
デプロイモードは、モデル推論の実行リージョンを決定します。各デプロイモードは特定のリージョンに紐付けられており、カスタムの組み合わせを作成することはできません。
ネットワーク遅延を低減し、モデルの応答速度を向上させるため、主なエンドユーザーおよびビジネスアプリケーションに地理的に最も近いリージョンに対応するデプロイモードを選択してください:
デプロイモード | 紐付けられたリージョン(データストレージ) | 推論範囲 |
Global | 米国 (バージニア) またはドイツ (フランクフルト) | グローバル動的スケジューリング |
International | シンガポール | 中国本土を除くグローバル動的スケジューリング |
United States | 米国 (バージニア) | 米国に限定 |
Chinese Mainland | 中国 (北京) | 中国本土に限定 |
Hong Kong (China) | 香港 (中国) | 香港 (中国) に限定 |
European Union | ドイツ (フランクフルト) | EU に限定 |
グローバルモード:世界中のユーザーに対して高い可用性を要求するワークロードに最適です。このモードでは、グローバルに分散されたコンピューティングリソースを活用して、高い可用性を確保します。
国際的モード:中国本土以外のユーザー(アジア太平洋地域や米国など)にサービスを提供する場合に最適です。事業要件またはコンプライアンス要件により、中国本土内のコンピューティングリソースの使用を除外する必要がある場合に適用します。
中国本土モード:主に中国本土内のユーザーにサービスを提供するアプリケーションに最適です。現地の法令および規制を厳格に遵守する必要があります。
米国モード:米国に拠点を置く組織、または米国法の適用を受ける組織に最適です。すべてのデータ処理およびモデル推論を米国内に厳密に限定する必要があります。
香港 (中国) モード:主に香港 (中国) のユーザーにサービスを提供する場合に最適です。データストレージおよびモデル推論を当該リージョン内に厳密に限定する必要があります。
EU モード:EU 内のユーザーにサービスを提供する場合、または EU 法の適用を受ける組織に最適です。すべてのデータ処理およびモデル推論を EU 内に厳密に限定する必要があります。
Global および International のデプロイモードでは、クロスボーダー計算が行われます。これらのモードを利用する場合は、クロスボーダーでのデータ処理が適用されるすべての法令および規制に準拠していることを確認してください。選択したリージョンのエンドポイントが、クロスリージョンの推論リクエストを受信します。モデル呼び出し時に生成される静的データ(プロンプト入力およびモデル出力など)は、モデル推論中に一時的に処理されるのみであり、コンピューティングリソースが配置されたリージョンの永続ストレージには書き込まれません。すべての転送中のデータは暗号化によって保護されます。
使用方法
使用 International デプロイモードモデル
リクエストアドレス、API キー、およびモデル名を構成します:
リクエストアドレス(ベース URL):シンガポールリージョンでホストされる国際的デプロイモードでは、
dashscope-intl.aliyuncs.comのドメイン名を使用します。その他の API については、対応するドキュメントをご参照ください。OpenAI Chat Completions API:
https://<u>dashscope-intl.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope-intl.aliyuncs.com</u>/api/v1
API キー: キー管理(シンガポール) ページから API キーを取得してください。
モデル名:「モデル一覧」から、このデプロイモードをサポートするモデルを選択してください。
使用 United States デプロイモードモデル
リクエストアドレス、API キー、およびモデル名を構成します:
リクエストアドレス(ベース URL):米国 (バージニア) リージョンにおける米国デプロイモードでは、
dashscope-us.aliyuncs.comのドメイン名を使用します。その他の API については、対応するドキュメントをご参照ください。OpenAI Chat Completions API:
https://<u>dashscope-us.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope-us.aliyuncs.com</u>/api/v1
API キー: キー管理(バージニア) ページから API キーを取得してください。
モデル名:「モデル一覧」から、米国デプロイモード(
-usサフィックス付き)のモデルを選択してください。
使用 Global デプロイモードモデル
グローバルデプロイモードでは、複数のリージョンがサポートされています。ご自身の事業要件に基づいてリージョンを選択してください。
米国 (バージニア) リージョン
開始する前に、リクエストアドレス、API キー、およびモデル名を構成してください:
リクエストアドレス(ベース URL):米国 (バージニア) リージョンでは、
dashscope-us.aliyuncs.comのドメイン名を使用します。その他の API については、関連するドキュメントをご参照ください:OpenAI Chat Completions API:
https://<u>dashscope-us.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope-us.aliyuncs.com</u>/api/v1
API キー: キー管理(バージニア) ページから API キーを取得してください。
モデル名:「モデル一覧」から、グローバルデプロイモードをサポートするモデルを選択してください。
ドイツ (フランクフルト) リージョン
「Model Studio コンソール」にアクセスし、ドイツ (フランクフルト) リージョンに切り替えて、右上隅の
アイコンをクリックして ワークスペース ID をコピーします。その後、リクエストアドレス、API キー、およびモデル名を構成してください。
リクエストアドレス(ベース URL):ドイツ (フランクフルト) リージョンでは、
{WorkspaceId}.eu-central-1.maas.aliyuncs.comのドメイン名を使用します。API 呼び出しを行う際には、{WorkspaceId}を実際のワークスペース ID に置き換えてください。以下に例を示します。その他の API については、対応するドキュメントをご参照ください。OpenAI Chat Completions API:
https://<u>{WorkspaceId}</u>.eu-central-1.maas.<u>aliyuncs.com</u>/compatible-mode/v1DashScope:
https://{WorkspaceId}.eu-central-1.maas.<u>aliyuncs.com</u>/api/v1
API キー: キー管理(フランクフルト) ページから API キーを取得してください。
モデル名:「モデル一覧」から、グローバルデプロイモードをサポートするモデルを選択してください。
使用: Chinese Mainland デプロイモードのモデル
リクエストアドレス、API キー、およびモデル名を構成します:
リクエストアドレス(ベース URL):中国本土デプロイモードでは、中国 (北京) リージョンおよび
dashscope.aliyuncs.comのサービスドメイン名を使用します。その他の API については、対応するドキュメントをご参照ください:OpenAI Chat Completions API:
https://<u>dashscope.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope.aliyuncs.com</u>/api/v1
API キー: キー管理(北京) ページから API キーを取得してください。
モデル名:「モデル一覧」から、このデプロイモードをサポートするモデルを選択してください。
使用 Hong Kong (China) デプロイモードモデル
リクエストアドレス、API キー、およびモデル名を構成します:
リクエストアドレス(ベース URL):香港 (中国) デプロイモードでは、香港リージョンで
cn-hongkong.dashscope.aliyuncs.comのドメイン名を使用します。以下に例を示します。その他の API については、対応するドキュメントをご参照ください。OpenAI Chat Completions API:
https://cn-hongkong.<u>dashscope.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://cn-hongkong.<u>dashscope.aliyuncs.com</u>/api/v1
API キー: キー管理(香港 (中国)) ページから API キーを取得してください。
モデル名:「モデル一覧」から、香港 (中国) デプロイモードをサポートするモデルを選択してください。
使用 European Union デプロイモードモデル
「Alibaba Cloud コンソール」にアクセスし、ドイツ (フランクフルト) リージョンに切り替えて、右上隅の
アイコンをクリックして ワークスペース ID をコピーします。その後、リクエストアドレス、API キー、およびモデル名を構成してください。
リクエストアドレス(ベース URL):EU デプロイモードはドイツ (フランクフルト) リージョンに紐付けられています。
{WorkspaceId}.eu-central-1.maas.aliyuncs.comのドメインを使用します。API 呼び出しを行う際には、{WorkspaceId}を実際のワークスペース ID に置き換えてください。以下に例を示します。その他の API については、対応するドキュメントをご参照ください:OpenAI Chat Completions API:
https://{WorkspaceId}.eu-central-1.maas<u>.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://{WorkspaceId}.eu-central-1.maas<u>.aliyuncs.com</u>/api/v1
API キー: キー管理(フランクフルト) ページから API キーを取得してください。
モデル名:「モデル一覧」から、EU デプロイモードをサポートするモデルを選択してください。
非同期タスク
画像または動画生成などの非同期タスクでは、後続のすべての操作で、タスク作成時に使用したサービスドメイン名および API キーを同じものにする必要があります。そうでない場合、リクエストは失敗します。
グローバルデプロイモード(米国リージョン)の例。ドイツリージョンの場合は、{WorkspaceId}.eu-central-1.maas.aliyuncs.com を使用します:
# グローバルデプロイモード(米国リージョン)で、サービスドメイン名 dashscope-us.aliyuncs.com を使用してタスクを作成
curl --location 'https://dashscope-us.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
"model": "wan2.6-t2i",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"text": "窓が美しく飾られた花屋、美しい木製のドア、店頭に並ぶ花"
}
]
}
]
},
"parameters": {
"n": 1
}
}'
# サンプル応答: {"output":{"task_id":"abc123..."},"request_id":"..."}
# タスクのステータスを照会。必ず同じサービスドメイン名を使用してください。
curl -X GET https://dashscope-us.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
# [エラー] 照会時に異なるサービスドメイン名を使用するとエラーになります。
curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"リージョン別の機能の可用性
機能の可用性はリージョンによって異なります:
カテゴリ | 機能 | シンガポール | 米国 (バージニア) | 中国 (北京) | 香港 (中国) | ドイツ (フランクフルト) |
使用 | リアルタイム推論 | |||||
バッチ推論 | ||||||
プレイグラウンド | ||||||
管理 | モニタリング(標準) | |||||
モニタリング(高度) | ||||||
モデルアラート機能 | ||||||
転送セキュリティ | ||||||
権限管理 | ||||||
最適化 | ファインチューニング |
参考文献
モデル一覧:対応モデルおよび仕様について。
モデル呼び出しの課金:デプロイモード別料金について。
レート制限:RPM および TPM 制限について。
API キーの取得:API キーの作成および管理について。