Alibaba Cloud Model Studio でモデルサービスを利用する際は、正しいリージョンとデプロイメントモードを選択してください。これらは、サービスの応答速度、コスト、利用可能なモデル、およびデフォルトのレート制限に影響します。
リージョン:モデルサービスのアクセスポイント (エンドポイント/ベース URL) と、プロンプトやモデルの出力などの静的データのストレージの場所を決定します。
デプロイメントモード:モデルの推論が計算される場所を決定します。
現在、リージョンとデプロイメントモードはシステムによって事前設定されており、自由に組み合わせることはできません。
リージョンの選択
次の点を考慮してください:
近接性:主な呼び出し元に最も近いリージョンを選択してください。これにより、通常はネットワーク遅延が短縮され、モデルの応答速度が向上します。
利用可能なプラットフォーム機能:Model Studio はリージョンごとに異なる機能を提供しています。詳細については、次の表をご参照ください。
カテゴリ
機能
中国 (北京)
米国
シンガポール
使用方法
リアルタイム推論
バッチ推論
プレイグラウンド
管理
モデルのモニタリング
モデルのアラート
伝送セキュリティ
権限管理
最適化
モデルのファインチューニング
サポートされているリージョン
名前 | ID | データストレージの場所 |
シンガポール |
| シンガポール |
米国 (バージニア) |
| バージニア |
中国 (北京) |
| 北京 |
デプロイメントモードの選択
デプロイメントモードによって、サポートされているモデル、モデル呼び出しの課金、レート制限が異なります。次の推奨事項を考慮してください:
グローバル:グローバルな計算能力リソースプールを使用する場合にこのモードを選択します。これにより、モデルの可用性が向上し、デフォルトのレート制限が増加します。
インターナショナル:中国本土外の計算リソースを使用する場合にこのモードを選択します。
米国:データ処理と推論を米国内でのみ行う場合にこのモードを選択します。
中国本土:中国本土内の計算リソースを使用し、データを処理する場合にこのモードを選択します。
サポートされているデプロイメントモード
デプロイメントモード | データストレージリージョン | 推論の計算範囲 | クロスボーダーコンピューティング |
グローバル | 米国 (バージニア) | グローバル | はい (クロスボーダーでのデータ処理の合法性はお客様の責任で確保する必要があります。) |
インターナショナル | シンガポール | グローバル (中国本土を除く) | はい (クロスボーダーでのデータ処理の合法性はお客様の責任で確保する必要があります。) |
米国 | 米国 (バージニア) | 米国内のみ | いいえ |
中国本土 | 中国 (北京) | 中国本土のみ | いいえ |
グローバルモードとインターナショナルモードでは、選択したリージョンのフロントエンドのエンドポイントがクロスリージョン推論リクエストを受信します。プロンプトやモデルの出力などの静的データは、推論中に一時的にのみ処理されます。このデータは、計算ノードのリージョンに永続ストレージとして保存されません。すべてのデータは伝送中に暗号化されます。
リージョンとデプロイメントモードの切り替え
Model Studio コンソールに移動し、ページ右上のリージョンアイコン
をクリックします。状況に応じてオプションを選択します:
中国本土モードを使用するには: [中国 (北京)] リージョンを選択します。
US モードまたはグローバルモードを使用するには: [US] リージョンを選択します。デプロイメントモードは、使用するモデル名によって決まります (モデルリストでご確認ください)。
モデル名に「-us」サフィックスが付いている場合 (米国モードを使用): 例:
qwen-flash-usおよびqwen-plus-us。モデル名に「-us」サフィックスが付いていない場合 (グローバルモードを使用): 例:
qwen-flashおよびqwen-plus。
国際モードを使用するには: [シンガポール] リージョンを選択します。