DataWorks の「モデルサービス」機能は、大規模言語モデル (LLM) を簡単にデプロイするための統合された方法を提供します。シンプルでガイド付きのインターフェイスにより、事前学習済みモデルを迅速にデプロイできます。本ドキュメントでは、DataWorks で Serverless リソースグループを使用してモデルサービスをデプロイする手順について説明します。
課金
以下の料金が発生します:
料金タイプ | 説明 |
DataWorks 料金 | モデルサービスは実行中に Serverless リソースグループからリソースを消費します。従量課金のリソースグループを使用してサービスをデプロイする場合、CU 時間単位で課金されます。詳細については、「Serverless リソースグループの課金」をご参照ください。 |
DataWorks 外部の料金 |
|
使用方法
DataWorks は、DataWorks リソースグループ内でフルマネージドモードでモデルサービスをデプロイします。モデルサービスへの安全なプライベートネットワークアクセスを有効化するために、システムは関連サービスの有効化を促し、自動的に PrivateLink および Private Hosted Zone を設定します。
PrivateLink は VPC 間アクセスを可能にし、Alibaba Cloud アカウント内の仮想プライベートクラウド (VPC) からフルマネージドのモデルサービスにアクセスできます。この VPC は DataWorks リソースグループと通信可能である必要があります。
Private Hosted Zone は、お客様のアカウント内でのカスタムドメイン名解決を提供し、VPC 内からドメイン名を用いて DataWorks のモデルサービスにアクセスできるようにします。
モデルサービスのドメイン名で呼び出しを行うと、トラフィックはお客様の VPC から確立された PrivateLink 接続を経由して DataWorks リソースグループの VPC へ流れ、最終的にその VPC 内のモデルインスタンスに到達します。これらのサービスの詳細は、PrivateLink コンソール および Alibaba Cloud DNS コンソール でご確認いただけます。
前提条件
PrivateLink サービスが有効化されていること。
モデルサービスは DataWorks プラットフォームアカウント内でフルマネージドとして運用されます。お客様の VPC からこのサービスにアクセスするには、PrivateLink を使用して安全な VPC 間アクセスを確立します。
Private Hosted Zone サービスが有効化されていること。
Private Hosted Zone は、お客様の VPC 内でのカスタムドメイン名解決を提供します。このサービスにより、モデルサービスのドメイン名を直接アクセス可能とし、リクエストトラフィックを DataWorks のモデルサービスに転送します。
DataWorks ワークスペース が作成され、Serverless リソースグループ と関連付けられていること。
これらのサービスを有効化するリージョンが、DataWorks ワークスペースのリージョンと一致していることを確認してください。一致しない場合、モデルサービスが正しく動作しない可能性があります。
制限事項
モデルサービスは、以下のリージョンでのみご利用いただけます:中国 (杭州)、中国 (上海)、中国 (北京)、中国 (ウランチャブ)、中国 (深セン)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、および米国 (バージニア)。
モデルのデプロイのみがサポートされています。モデルのトレーニングはサポートされていません。
各 Alibaba Cloud アカウントは、リージョンあたり最大 50 個のモデルサービスをデプロイできます。
本機能は Serverless リソースグループのみをサポートしています。各リソースグループは最大 5 個のモデルサービスをデプロイできます。
各モデルサービスは、最大 3 個の VPC と関連付けることができます。
モデルサービスページ
DataWorks コンソール にログインします。 画面上部のナビゲーションバーで、対象のリージョンに切り替えます。
左側のナビゲーションウィンドウで、モデルサービス をクリックし、モデルサービス ページに移動します。
サービスのデプロイ
モデルサービス ページで、モデルのデプロイ をクリックして モデル一覧 ページを開きます。デプロイするモデルを選択し、デプロイ をクリックして モデルデプロイ構成 ページを開きます。
基本情報
モデル:DataWorks リソースグループにデプロイするモデルの種類を確認します。詳細については、「サポートされるモデル」をご参照ください。
サービス名:モデルサービスのカスタム名を入力します。この名前は、DataWorks 内でデプロイ済みのモデルサービスを識別するために使用されます。
リソース情報
モデルのデプロイ環境を構成します。
パラメーター | 説明 |
リソースグループ | モデルサービスをデプロイする Serverless リソースグループです。 DataWorks コンソール にログインし、対象のリージョンに切り替えた後、左側のナビゲーションウィンドウで リソースグループ をクリックします。リソースグループ一覧ページで、対象の リソースグループ名 をクリックし、リソースグループの 詳細 ページに移動して、モデルサービスの Serverless リソースグループ使用状況 を確認できます。 |
vSwitch | モデルサービスのデプロイに使用する vSwitch です。 画面上の指示に従い、適切な可用性ゾーンで Serverless リソースグループと関連付けられた vSwitch を選択してください。 |
デプロイ仕様 | 各サービスインスタンスのリソース仕様です。 |
インスタンス数 | モデルサービスにデプロイするインスタンスの数です。複数のインスタンスをデプロイすることで、サービスの高可用性が向上します。 |
合計占有量 | モデルサービスに必要な合計 CU 数で、デプロイ仕様 × インスタンス数 で算出されます。 リソースグループにデプロイに十分な空き CU があることを確認してください。リソースグループのクォータ管理ページにアクセスし、モデルサービスに割り当てる CU 制限を調整できます。詳細については、「タスクへの CU クォータの割り当て」をご参照ください。
|
構成を完了したら、デプロイ をクリックします。
モデルサービスの作成時に、プラットフォームが自動的に必要な PrivateLink、Private Hosted Zone、およびセキュリティグループのリソースを作成します。これらのリソースを手動で削除または編集しないでください。モデルサービスがリリースされると、プラットフォームが自動的にこれらのリソースを削除します。
デプロイが完了すると、システムはお客様のアカウントで以下の操作を実行します:
システムは、DataWorks リソースグループと関連付けられたデフォルト VPC 内に PrivateLink エンドポイントを作成し、DataWorks リソースグループの VPC 内の PrivateLink サービスとの暗号化された通信チャネルを確立します。
システムは、お客様のアカウント内の Private Hosted Zone サービスに解決レコードを追加し、プライベートドメイン名を DataWorks リソースグループの VPC 環境に関連付けます。
サービスの管理
モデルサービスが作成された後、モデルサービス 一覧から、サービスの状態管理、サービス情報の表示、ネットワーク設定および API キーの管理、必要に応じたリソースの調整が可能です。
サービス状態の管理
モデルサービスは作成後にデフォルトで起動します。操作 列の モデルサービス 一覧から、サービスの状態を管理できます。
操作 | 結果となる状態 | リソース消費 |
起動 | 実行中 | Serverless リソースグループからリソースを消費します。 |
停止 | 停止済み | Serverless リソースグループからリソースを消費しません。 |
削除 | ― | Serverless リソースグループから関連するすべてのリソースを完全に解放します。 |
サービスの詳細
概要 タブには、現在のモデルサービスの構成情報が表示されます。概要 タブでは、サービスの 基本情報、リソース構成、および 呼び出し情報 を管理できます。
モデルサービス 一覧で対象のモデルサービスを見つけ、サービス名 をクリックして 概要 タブに移動します。
モデルサービスの基本情報、リソース情報、および呼び出し情報を確認します。
基本情報:モデルの サービス名、サービス ID、および モデル の種類が含まれます。
リソース割り当て:デプロイ仕様 や インスタンス数 などの情報を表示します。
呼び出し情報: ノードタスクでモデルを使用するには、[VPC アドレス呼び出しドメイン名] の横にある
アイコンをクリックしてドメイン名をコピーします。
リソースの変更
既存のモデルサービスの名前を変更したり、リソース仕様を調整したり、デプロイ済みのインスタンス数を変更したりできます。
モデルサービス 一覧で対象のモデルサービスを見つけ、サービス名 をクリックして 概要 タブに移動します。
リソース割り当て セクションで、変更 をクリックして リソースの変更 ページに移動し、設定を構成します。
重要リソースの変更によりサービスが再起動し、サービス可用性が一時的に中断されます。
ネットワーク設定
ネットワーク構成 タブには、現在モデルサービスに内部ネットワーク経由でアクセス可能な VPC 環境が表示されます。ネットワーク構成 タブでは、モデルサービスへのアクセスに使用する仮想プライベートクラウド (VPC) を追加または管理できます。
モデルサービス 一覧で対象のモデルサービスを見つけ、サービス名 をクリックして 概要 タブに移動します。
ネットワーク構成 タブに切り替えて、現在プライベートネットワーク経由でモデルサービスにアクセス可能な VPC を表示します。
アクセス範囲を拡大するには、ネットワークの追加 をクリックして、DataWorks でデプロイされたモデルサービスへのアクセスを許可する VPC をさらに追加します。
ネットワークを追加する際には、VPC および vSwitch を指定する必要があります。VPC の ステータス が 利用可能 に変更された後、モデルサービスにアクセスできます。
説明課金:モデルサービスに VPC を追加すると、システムは選択した VPC 内に PrivateLink エンドポイントを作成し、DataWorks リソースグループとのネットワーク接続を確立します。また、Private Hosted Zone に解決レコードも追加されます。この処理により、インスタンス料金、データ転送料金、およびドメイン名解決料金が発生します。詳細については、「PrivateLink の課金」および「Private Hosted Zone の課金」をご参照ください。
制限:各モデルサービスに対して追加できる VPC の最大数は 3 個です。
VPC によるモデルサービスへのアクセスを不要とする場合は、対象の VPC 環境の横にある 削除 をクリックします。
VPC をモデルサービスから削除すると、その VPC 内に作成された PrivateLink エンドポイントも同時に削除されます。
API キー
API キーは、モデルサービスが呼び出し元の ID および権限を検証するための認証情報です。現在のモデルサービスのすべての API キーは、API キー タブで管理できます。
モデルサービス 一覧で対象のモデルサービスを見つけ、サービス名 をクリックして 概要 タブに移動します。
API キー タブに切り替えて、API キーの作成・管理・利用を行います:
API キーの追加:モデルサービスがデプロイされると、プラットフォームは DataWorks の他のモジュールからの呼び出し用に組み込みの API キーを提供します。サービスの
エンドポイントを使用して他の環境からモデルサービスを呼び出すには、新しい API キーの追加 をクリックして新しい API キーを作成します。アプリケーションごとに個別の API キーを作成することを推奨します。
API キーの表示:対象の API キーの 操作 列で 表示 をクリックし、その後 コピー をクリックして API キーを取得します。
API キーの削除:DataWorks の API キーを 無効化 または 削除 できます。
重要無効化 または 削除 を実行する前に、潜在的な影響を評価してください。API キーが 無効化 または 削除 されると、そのキーを使用してサービスを呼び出すすべてのタスクが失敗します。
無効化 または 削除 の操作は、約
5分で有効になります。
次のステップ
モデルがデプロイされた後、タスク内で モデルサービスを利用する ことができます。
呼び出し
以下の図および説明では、モデルサービスの呼び出しの仕組みについて説明します:
モデルサービスを DataWorks リソースグループにデプロイするか、VPC を構成する際に、システムは以下の操作を自動的に実行します:
お客様の VPC 内に PrivateLink エンドポイントを作成することで、VPC 間接続を確立します。これにより、DataWorks リソースグループ VPC 内の PrivateLink サービスとの暗号化された通信チャネルが確立されます。
この操作により、お客様のアカウント内に PrivateLink エンドポイントが自動的に作成されます。お客様のアカウントでは PrivateLink サービスが有効化されている必要があります。
モデルサービスと関連付けられた VPC に自動的にルールを追加することで、ドメイン名解決を構成します。これにより、内部ドメイン名のリクエストが DataWorks のモデルサービスに自動的に転送されます。
この操作により、お客様のアカウント内に Private Hosted Zone サービスが自動的に展開されます。お客様のアカウントではこのサービスが有効化されている必要があります。