Alibaba Cloud Model Studio を使用する複数のビジネスまたはシナリオがある場合は、個別のワークスペースを作成して独立して管理します。これにより、各ワークスペースが呼び出しできるモデルを制御し、コスト配分を実装し、それぞれのユーザーデータを分離できます。
ワークスペースのタイプ
Model Studio は、デフォルトワークスペースとサブワークスペースの 2 種類のワークスペースを提供します。
項目 | デフォルトワークスペース | サブワークスペース |
作成方法 | Model Studio をアクティベートすると自動的に作成されます。 | Alibaba Cloud アカウントまたは管理権限を持つ RAM ユーザーによって手動で作成されます。 |
一意性 | Alibaba Cloud アカウント配下でグローバルに一意です。 | 1 つの Alibaba Cloud アカウント配下に複数のサブワークスペースが存在できます。 |
ワークスペース内のモデル権限 | 権限付与なしですべてのモデルを呼び出しできます。 | 指定されたモデルを呼び出すには権限付与が必要です。 |
特別な識別子 | ワークスペースページでは、このワークスペースには [デフォルト] のマークがありません。 |
はじめに
新しいワークスペースの作成
この操作には Alibaba Cloud アカウントを使用する必要があります。RAM ユーザーを使用する場合、RAM ユーザーには Alibaba Cloud アカウントから管理権限が付与されている必要があります。
ワークスペースは作成後に名前を変更できますが、削除はできません。
新しいサービスまたはシナリオ用に、サブワークスペースとも呼ばれる個別のワークスペースを作成できます。ワークスペース内のモデル、リソースコスト、およびユーザーデータは、他のワークスペースから完全に分離されます。
手順:
右上隅にある [ワークスペースの追加] をクリックします。表示されるダイアログボックスで、ワークスペースの名前を入力します。
[OK] をクリックします。
次のステップ: ワークスペースのメンバーと権限の管理
ワークスペース ID の取得
ワークスペース ID は、生成後に変更されないワークスペースの一意の識別子です。例: llm-7c72iiw36kd8****。
Alibaba Cloud アカウント配下のすべてのワークスペースの ID を取得するには: ワークスペース (シンガポールまたは北京) ページに移動します。
Alibaba Cloud アカウントまたは管理権限を持つ RAM ユーザーを使用する必要があります。そうしないと、ページにアクセスしようとするとエラーが報告されます。
現在のワークスペースの ID を取得するには: Model Studio ホームページ (シンガポールまたは北京)で、左下隅の
をクリックし、次に [ワークスペースの詳細] をクリックします。管理者権限のない RAM ユーザーは、参加しているサブワークスペースの ID のみを表示できます。
ワークスペース間の切り替え
ワークスペースは互いに独立しています。すべてのワークスペースのコンテンツを同時に表示することはできません。代わりに、特定のワークスペースに切り替えて、そのモデル、コスト情報、およびユーザーデータを表示する必要があります。
切り替え方法: Model Studio ホームページ (シンガポールまたは北京)で、左下隅の
をクリックします。リスト内のさまざまなワークスペースを表示して切り替えることができます。
目的のワークスペースがリストにない場合、現在の RAM ユーザーがそのワークスペースに参加していないことを意味します。ワークスペースへの参加方法。
サブワークスペースにモデルの呼び出しを権限付与する
この操作には Alibaba Cloud アカウントを使用する必要があります。RAM ユーザーを使用する場合、RAM ユーザーには管理権限が付与され、モデルの権限付与が必要なワークスペースのメンバーとして追加されている必要があります。
サブワークスペースは、qwen-plus などの特定のモデルについて必要な権限が付与された後にのみ、そのモデルを呼び出しできます。
手順:
モデル呼び出しのレート制限の設定
この操作には Alibaba Cloud アカウントを使用する必要があります。RAM ユーザーを使用する場合、RAM ユーザーには管理権限が付与され、ワークスペースのメンバーとして追加されている必要があります。
異なるサービスまたはシナリオ間で公平なモデル呼び出しを確保するために、異なるサブワークスペースに対して独立した呼び出しレート制限を設定できます。
エントリポイント: ワークスペース (シンガポールまたは北京) ページで、目的のサブワークスペースを見つけ、右側の [権限付与とスロットリング設定] をクリックします。
仕組み:
ワークスペース内では、レート制限はモデルレベルで制御されます。たとえば、
qwen-plusモデルの場合、システムはワークスペース内のすべての API キーからのqwen-plusへのリクエストの総数をカウントし、このカウントに基づいて制限を適用します。モデル呼び出し制限は、[リクエスト数制限] と [トークン制限] の 2 つの独立した方法で測定されます。どちらかの制限に達するとすぐに制限がトリガーされます。
たとえば、リクエストレート制限が 1 分あたり 20 リクエスト (RPM) で、トークンレート制限が 1 分あたり 100,000 トークン (TPM) であるとします。1 分以内にモデルに 20 リクエストを送信し、消費したトークンが 1,000 のみ (100,000 TPM 制限未満) であっても、リクエスト数が RPM 制限に達したため、制限がトリガーされます。
主な制限事項:
デフォルトワークスペースは制限設定をサポートしていません。このワークスペース内のすべてのモデルの制限は、Alibaba Cloud アカウントの制限と同じです。
すべてのワークスペースにわたるモデルへの呼び出しの総数は、そのモデルの Alibaba Cloud アカウントのレート制限を超えることはできません。
モデル呼び出しの制限はリアルタイム呼び出しに適用されますが、バッチ推論タスクには適用されません。
ワークスペース内の特定のメンバーに対して制限を設定することはできません。
本番稼働
ワークスペース計画戦略
環境別 (推奨): 開発、テスト、準本番、本番環境用に個別のワークスペースを作成し、厳密な環境の隔離を実現します。
project-dev-workspaceproject-test-workspaceproject-prod-workspace
LOB (事業部門) 別: マーケティング、アフターサービス、デザインなど、社内のさまざまな事業部門用に個別のワークスペースを作成します。これにより、権限とコスト管理が簡素化されます。
marketing-team-workspacecustomer-team-workspace
レート制限戦略
Alibaba Cloud アカウントの合計クォータを各ワークスペースに比例して割り当てます。トラフィックのバーストを処理するためのバッファーとして一部を予約します。
例: アカウントの合計クォータは 1,000 RPM です。割り当て計画は次のとおりです:
project-prod-workspace: 600 RPM (60%)project-test-workspace: 200 RPM (20%)project-dev-workspace: 100 RPM (10%)予約済みバッファー: 100 RPM (10%)
セキュリティと権限
デフォルトワークスペースには、すべてのモデルを呼び出しする権限があり、重大なセキュリティリスクをもたらします。
推奨事項:
本番サービスにデフォルトワークスペースを使用しないでください。
デフォルトワークスペースは、初期のテストまたは管理者操作にのみ使用してください。
開発、テスト、本番などのすべての公式サービスに対して、個別のサブワークスペースを作成および管理してください。
クォータと制限
Alibaba Cloud アカウントあたりの最大ワークスペース数: シンガポールリージョンでは 10、北京リージョンでは 20。どちらの制限にも 1 つのデフォルトワークスペースが含まれます。
削除はサポートされていません: ワークスペースは作成後に削除できません。
課金
ワークスペースの作成と管理は無料です。
料金は、各ワークスペース内のモデル呼び出しなどのリソース消費に基づいて発生します。


