既存の Container Service for Kubernetes (ACK) クラスターを Platform for AI (PAI) に接続し、Data Science Workshop (DSW) の開発および Deep Learning Containers (DLC) のトレーニングジョブ用のコンピューティングリソースとして使用します。
前提条件
PDSA にお問い合わせのうえ、以下の準備を完了してください。
PAI で使用する ACK クラスターが準備されていること。
アカウントが許可リストに登録されていること。
自己管理型コンピューティングリソースの設定
ステップ1:リソースグループの作成
まず、PAI でリソースグループを作成し、指定の ACK クラスターにマッピングします。
PAI コンソール にログインします。左上隅で、ACK クラスターがあるリージョンを選択します。
左側のナビゲーションペインで、AI Computing Resources > Resource Pool を選択します。
Self-managed compute タブをクリックし、Create Resource Group をクリックします。ダイアログボックスで、ドロップダウンリストから ACK クラスターを選択します。
ステップ2:リソースクォータの追加
リソースグループを作成した後、リソースクォータを設定します。このクォータにより、料金が発生することなく、リソース分離と管理が可能になります。
詳細な手順については、「リソースクォータの追加」をご参照ください。
[Resource Quota] ページで [Self-managed compute] タブをクリックし、左上隅の [Add a resource quota] をクリックします。
自己管理型コンピューティングリソースの使用
設定完了後、さまざまな PAI コンポーネントで自己管理型コンピューティングリソースを使用できます。
DSW インスタンスでの使用
Resource Information セクションで、Resource Type を Resource Quota に設定し、ドロップダウンリストから自己管理型コンピューティングリソースのリソースクォータを選択します。
これにより [Resource Overview] セクションに GPU タイプ (例:V100) と [Intelligent Policy] タグが表示されます。以下の仕様テーブルには、仕様名、ノード総数、GPU モデル、GPU 数、vCPU コア、メモリなどのクォータ詳細が一覧表示されます。
DLC での使用
DLC ジョブを作成するときは、Resource Type を Self-managed compute に、Source を Resource Quota に設定します。 次に、ドロップダウンリストからセルフマネージドコンピューティングリソースのリソースクォータを選択します。
インターフェイスに、選択したリソースクォータの仕様 (仕様名、GPU モデル、GPU 数、vCPU コア、メモリなど) が表示されます。
リソースの使用状況
自己管理型のコンピューティングリソースの使用状況は、Overview タブにある Resource Overview ページで確認できます。
[Self-managed compute] タブをクリックすると、名前、ステータス、ノード数、GPU 数など、自己管理型コンピューティングリソースに関する詳細を確認できます。