Platform for AI (PAI) の Deep Learning Containers (DLC) は、柔軟で安定した、使いやすい高性能の機械学習およびトレーニング環境を提供します。DataWorks は PAI DLC ノードを提供します。このタイプのノードを使用して、既存の DLC タスクを読み込み、スケジューリング依存関係を構成して、DLC タスクの定期的なスケジューリングを実装できます。
前提条件
DataWorks に PAI へのアクセスが承認されています。
承認ページ で数回クリックするだけで承認を完了できます。 承認に基づいて作成されるサービスロールの詳細については、「ロール 1: AliyunServiceRoleForDataworksEngine」をご参照ください。 [aliyundataworksfullaccess] ポリシーがアタッチされている Alibaba Cloud アカウントまたは RAM ユーザーのみが、ワンクリック承認を実行できます。
PAI DLC ノードが作成されます。
手順
PAI DLC ノードの構成タブで、次の操作を実行してタスクを開発します。
タスクコードの開発
ビジネス要件に基づいて、次のいずれかの方法を使用して DLC タスクコードを記述できます。
既存の DLC タスクに基づいてタスクコードを記述する
タスク名で PAI に作成された DLC タスクを読み込むことができます。 タスクを読み込むと、DLC ノードエディターは PAI のタスクの構成に基づいてノードコードを生成します。 その後、コードに基づいてタスク構成を変更できます。
説明タスクの読み込みまたは作成に必要な権限がない場合は、画面の指示に従って必要な権限を取得してください。
使用可能なタスクがない場合は、PAI コンソールでタスクを作成します。 PAI で DLC タスクを作成するには、さまざまな方法が用意されています。 ビジネス要件に基づいて方法を選択できます。 詳細については、「トレーニングジョブを送信する」、「Python 用 SDK を使用してジョブを送信する」、および「CLI を使用してジョブを送信する」をご参照ください。
DLC タスクコードを直接記述する
DataWorks の PAI DLC ノードのコードエディターで、ビジネス要件に基づいてタスクコードを記述します。
dlc submit xgboostjob \ # DLC タスクを送信します。 --name=wsytest_pai04_XGBoost \ # DLC タスクの名前。 DataWorks の変数名またはノード名を使用することをお勧めします。 --command='echo '\''${Variable}'\'';' \ # DLC タスクで実行するコマンド。 --workspace_id=80593 \ # DLC タスクを実行するワークスペース。 --priority=1 \ # タスクの優先度。 有効な値: 1 ~ 9。 値 1 は最低優先度を指定します。 値 9 は最高優先度を指定します。 --workers=1 \ # タスクを実行するノードの数。 ノード数が 1 より大きい場合、タスクは分散タスクであり、複数のノードで同時に実行できます。 --worker_image=registry.cn-hangzhou.aliyuncs.com/pai-dlc/tensorflow-training:2.3-cpu-py36-ubuntu18.04 \ # DLC タスクにランタイム環境を提供するために使用されるノードイメージ。 --worker_spec=ecs.g6.xlarge # 計算ノードのインスタンスタイプ。PAI DLC タスクコードを記述したら、タスクを実行します。
[デバッグ構成] タブで、[リソースグループ] パラメーターを構成します。
[リソースグループ] ドロップダウンリストから、データソースに接続されているスケジューリング用のリソースグループを選択します。 詳細については、「ネットワーク接続ソリューション」をご参照ください。
上部のツールバーで、[実行] をクリックしてノードを実行します。
ノードを定期的に実行する場合は、ビジネス要件に基づいてスケジューリング情報を構成します。
ノードを構成したら、ノードをデプロイします。 詳細については、「ノードのデプロイ」をご参照ください。
ノードをデプロイしたら、オペレーションセンターでノードの実行ステータスを表示します。 詳細については、「オペレーションセンターの概要」をご参照ください。