Model Studio を呼び出す前に、リージョン、サービスデプロイ範囲、アクセスドメインを選択します。
-
リージョン: アクセスポイントとデータストレージの場所を決定します。レイテンシーを削減するために、近隣のリージョンを選択してください。
-
サービスデプロイ範囲: 推論の実行場所を決定します。データレジデンシー要件がある場合は、特定の地理的境界を持つ範囲を選択します。それ以外の場合は、より大きな推論リソースプールを利用できるグローバル範囲を選択します。
-
アクセスドメイン: 同時実行数制限、タイムアウト、その他のサービス保証に影響します。各リージョンには、独自の専用アクセスドメインがあります。
モデル呼び出しの全体的な仕組みは次のとおりです。
-
ご利用のアプリケーションは、アクセスドメインを介して、選択したリージョン (例:シンガポール) にリクエストを送信します。リクエストデータはそのリージョンに保存されます。
-
リージョンは、リクエストをサービスデプロイ範囲内の推論ノードに転送します (一時データは永続化されず、すべての通信は暗号化されます)。
-
推論結果はリージョンに返されて保存された後、ご利用のアプリケーションに返送されます。静的データは常に選択したリージョン内に保持されます。
リージョンとサービスデプロイ範囲の選択
ご利用のシナリオに基づいて、リージョンとサービスデプロイ範囲を選択します。
|
シナリオ |
リージョン |
サービスデプロイ範囲 |
|
データレジデンシーの制限なし。クロスリージョンスケジューリングにより推論リソースプールを最大化 (国境を越えるコンプライアンスは各自で確保)。 |
米国 (バージニア) |
グローバル (中国内外の利用可能な任意のノード) |
|
データレジデンシーの制限なし。クロスリージョンスケジューリングにより推論リソースプールを最大化 (国境を越えるコンプライアンスは各自で確保)。 |
ドイツ (フランクフルト) |
グローバル (中国内外の利用可能な任意のノード) |
|
データレジデンシーの制限なし。クロスリージョンスケジューリングにより推論リソースプールを最大化 (国境を越えるコンプライアンスは各自で確保)。 |
日本 (東京) |
グローバル (中国内外の利用可能な任意のノード) |
|
データレジデンシーの制限なし。クロスリージョンスケジューリングにより推論リソースプールを最大化 (国境を越えるコンプライアンスは各自で確保)。 |
中国 (香港) |
グローバル (中国内外の利用可能な任意のノード) |
|
データは中国本土を経由しないこと (クロスリージョンスケジューリング。国境を越えるコンプライアンスは各自で確保)。 |
シンガポール |
インターナショナル (中国本土を除くグローバルノード) |
|
データは中国本土内に留まること |
中国 (北京) |
中国本土 (推論は中国に限定) |
|
データは中国 (香港) 内に留まること |
中国 (香港) |
中国 (香港) (推論は香港に限定) |
|
データは米国内に留まること |
米国 (バージニア) |
米国 (推論は米国に限定) |
|
データは EU 内に留まること |
ドイツ (フランクフルト) |
EU (推論は EU に限定) |
|
データは日本国内に留まること |
日本 (東京) |
日本 (推論は日本に限定) |
アクセスドメインの選択
Model Studio は、モデル推論 API 用に専用、共有、トライアルの 3 種類のアクセスドメインを提供しており、トライアルからエンタープライズレベルの本番環境までのシナリオをカバーしています。専用ドメインの使用を推奨します。主な違いは次のとおりです。
|
比較項目 |
専用ドメイン (推奨) |
共有ドメイン (既存ドメイン) |
トライアルドメイン |
|
ドメインフォーマット |
|
シンガポールリージョンを例として使用 |
|
|
ユースケース |
本番環境に推奨されます。より高い同時実行性能とネットワーク分離を提供し、高トラフィック下でも安定した低レイテンシーのアクセスを保証します。 |
既存の統合向けです。専用ドメインへの移行を推奨します。 |
迅速なトライアルと機能検証向けです。本番環境での使用は推奨されません。 |
|
認証範囲 |
現在のワークスペースへのアクセスのみ |
すべてのワークスペースへのアクセス |
すべてのワークスペースへのアクセス |
|
レート制限 |
RPM と TPM はモデルによって異なります |
RPM と TPM はモデルによって異なります |
RPM は 1000、TPM はモデルによって異なります |
|
リクエストタイムアウト |
3600 秒 |
600 秒 |
600 秒 |
|
プロトコルサポート |
HTTP、SSE、WebSocket、WebRTC |
HTTP、SSE、WebSocket |
HTTP、SSE |
|
SLA |
99.9% |
99.9% |
提供なし |
リージョン別のアクセス情報
各リージョンには、独自のアクセスドメイン、API キー、モデルリストがあります。これらはリージョンをまたいで使用することはできません。
|
リージョン |
リージョン ID |
専用ドメイン |
共有ドメイン |
トライアルドメイン |
API キー |
モデルリスト |
|
中国 (北京) |
|
|
|
|
||
|
シンガポール |
|
|
|
|
||
|
ドイツ (フランクフルト) |
|
|
サポート対象外 |
未サポート |
||
|
日本 (東京) |
|
|
サポート対象外 |
未サポート |
||
|
中国 (香港) |
|
|
|
|
||
|
米国 (バージニア) |
- |
未サポート |
|
未サポート |
-
ドイツ (フランクフルト)、日本 (東京)、中国 (香港) リージョンでは、ワークスペースを使用してサービスデプロイ範囲を分離します。API を呼び出す前に、ワークスペース管理ページに移動してワークスペースを作成し、サービスデプロイ範囲を選択してください: ドイツ (フランクフルト) (グローバル/EU)、日本 (東京) (グローバル/日本)、中国 (香港) (グローバル/香港)。
-
米国 (バージニア) リージョン:
-usサフィックスが付いたモデル名 (例:qwen-plus-us) を使用すると、推論が米国内に制限されます。サフィックスがない場合、推論はデフォルトでグローバル範囲になります。 -
中国 (北京) および シンガポール リージョンは、それぞれ 1 つのサービスデプロイ範囲 (中国本土およびインターナショナル) のみをサポートしているため、選択は不要です。
専用ドメインへの移行
共有ドメインまたはトライアルドメインから専用ドメインへの移行は、ビジネスロジックコードを変更することなく、わずか 2 ステップで完了します。
-
専用ドメインの取得:
-
ベース URL のドメインを置換: 元のドメインを専用ドメインに置き換えます。中国 (北京) リージョンを例に、ワークスペース ID が
llm-xxxの場合:-
OpenAI 互換:
https://dashscope.aliyuncs.com/compatible-mode/v1をhttps://llm-xxx.cn-beijing.maas.aliyuncs.com/compatible-mode/v1に置き換えます -
DashScope:
https://dashscope.aliyuncs.com/api/v1をhttps://llm-xxx.cn-beijing.maas.aliyuncs.com/api/v1に置き換えます -
Anthropic 互換:
https://dashscope.aliyuncs.com/apps/anthropicをhttps://llm-xxx.cn-beijing.maas.aliyuncs.com/apps/anthropicに置き換えます
-
リージョン別の機能提供状況
|
機能 |
シンガポール |
米国 (バージニア) |
中国 (北京) |
中国 (香港) |
ドイツ (フランクフルト) |
日本 (東京) |
|
リアルタイム推論 |
|
|
|
|
|
|
|
バッチ推論 |
|
|
|
|
|
|
|
プレイグラウンド |
|
|
|
|
|
|
|
モニタリング (標準) |
|
|
|
|
|
|
|
モニタリング (高度) |
|
|
|
|
|
|
|
アラート |
|
|
|
|
|
|
|
通信セキュリティ |
|
|
|
|
|
|
|
権限 |
|
|
|
|
|
|
|
ファインチューニング |
|
|
|
|
|
|