すべてのプロダクト
Search
ドキュメントセンター

DataWorks:PAI DLC ノード

最終更新日:Feb 28, 2025

Platform for AI (PAI) の Deep Learning Containers (DLC) は、柔軟で安定した、使いやすい高性能の機械学習およびトレーニング環境を提供します。DataWorks は PAI DLC ノードを提供します。このタイプのノードを使用して、既存の DLC タスクを読み込み、スケジューリング依存関係を構成して、DLC タスクの定期的なスケジューリングを実装できます。

前提条件

  • DataWorks に PAI へのアクセスが承認されています。

    承認ページ で数回クリックするだけで承認を完了できます。 承認に基づいて作成されるサービスロールの詳細については、「ロール 1: AliyunServiceRoleForDataworksEngine」をご参照ください。 [aliyundataworksfullaccess] ポリシーがアタッチされている Alibaba Cloud アカウントまたは RAM ユーザーのみが、ワンクリック承認を実行できます。

  • PAI DLC ノードが作成されます。

手順

  1. PAI DLC ノードの構成タブで、次の操作を実行してタスクを開発します。

    タスクコードの開発

    ビジネス要件に基づいて、次のいずれかの方法を使用して DLC タスクコードを記述できます。

    既存の DLC タスクに基づいてタスクコードを記述する

    タスク名で PAI に作成された DLC タスクを読み込むことができます。 タスクを読み込むと、DLC ノードエディターは PAI のタスクの構成に基づいてノードコードを生成します。 その後、コードに基づいてタスク構成を変更できます。

    image

    説明

    DLC タスクコードを直接記述する

    DataWorks の PAI DLC ノードのコードエディターで、ビジネス要件に基づいてタスクコードを記述します。

    dlc submit xgboostjob \   # DLC タスクを送信します。
        --name=wsytest_pai04_XGBoost \   # DLC タスクの名前。 DataWorks の変数名またはノード名を使用することをお勧めします。
        --command='echo '\''${Variable}'\'';' \   # DLC タスクで実行するコマンド。
        --workspace_id=80593 \   # DLC タスクを実行するワークスペース。
        --priority=1 \   # タスクの優先度。 有効な値: 1 ~ 9。 値 1 は最低優先度を指定します。 値 9 は最高優先度を指定します。
        --workers=1 \    # タスクを実行するノードの数。 ノード数が 1 より大きい場合、タスクは分散タスクであり、複数のノードで同時に実行できます。
        --worker_image=registry.cn-hangzhou.aliyuncs.com/pai-dlc/tensorflow-training:2.3-cpu-py36-ubuntu18.04 \   # DLC タスクにランタイム環境を提供するために使用されるノードイメージ。
        --worker_spec=ecs.g6.xlarge   # 計算ノードのインスタンスタイプ。

  2. PAI DLC タスクコードを記述したら、タスクを実行します。

    1. [デバッグ構成] タブで、[リソースグループ] パラメーターを構成します。

      [リソースグループ] ドロップダウンリストから、データソースに接続されているスケジューリング用のリソースグループを選択します。 詳細については、「ネットワーク接続ソリューション」をご参照ください。

    2. 上部のツールバーで、[実行] をクリックしてノードを実行します。

  3. ノードを定期的に実行する場合は、ビジネス要件に基づいてスケジューリング情報を構成します。

  4. ノードを構成したら、ノードをデプロイします。 詳細については、「ノードのデプロイ」をご参照ください。

  5. ノードをデプロイしたら、オペレーションセンターでノードの実行ステータスを表示します。 詳細については、「オペレーションセンターの概要」をご参照ください。