すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:DLCジョブの通知ルール

最終更新日:Apr 01, 2026

PAI ワークスペースのイベント通知設定で通知ルールを作成し、Deep Learning Containers (DLC) ジョブのステータスを追跡および監視できます。

通知ルールの設定

  1. ワークスペース詳細ページで、Configure Workspace > Configure Event Notification に移動し、Create Event Rule をクリックします。image

  2. Create Event Rule パネルで、次のパラメーターを設定し、Submit をクリックします。

    image

    パラメーター

    説明

    Rule Name

    ルールのカスタム名を入力します。

    Event Type

    イベントソースで、DLC ジョブを選択します。複数のイベントを選択できます。サポートされているイベントタイプは次のとおりです:

    • Job Progress

      • Enter Queue:ジョブが実行のためにキューに追加されます。

      • Start Bidding:ジョブがインスタンスの入札を開始します。

      • Start Environment Preparation:ジョブが実行環境の準備を開始します。

      • Start Run:ジョブが実行を開始します。

      • Retained upon Success:ジョブが正常に完了した後も保持されます。

      • Retained upon Failure:ジョブが失敗した後も保持されます。

      • Job Failure:ジョブの実行が失敗します。

      • Job Completed (Succeeded or Failed):ジョブが成功または失敗して終了します。

    • Automatic Fault Tolerance:DLC ジョブで自動フォールトトレランスがトリガーされたときに通知を送信します。

    • Job Timeout:このオプションを選択した場合、まず対応するワークスペースのスケジューリング設定ページでタイムアウトルールを設定する必要があります。詳細については、「タイムアウトアラートルールの設定」をご参照ください。

      • Queue Timeout:ジョブのキュー滞在時間が設定された最大値を超えました。

      • Environment Preparation Timeout:ジョブの環境準備時間が設定された最大値を超えました。

      • Wait Timeout:ジョブ作成から実行までの合計待機時間が設定された最大値を超えました。

      • Run Timeout:ジョブの実行時間が設定された最大値を超え、自動停止がトリガーされます。

    • Other Events

      • Job Preempted:アイドル状態または入札中のジョブがプリエンプトされたときに通知します。

      • Job Manually Stopped

      • Job Priority Modified

    Event Scope

    次のオプションが利用可能です:

    • Created by Me:自分が作成した DLC ジョブにのみ適用されます。

    • In the current workspace:現在のワークスペース内のすべての DLC ジョブに適用されます。

    • Specify Task:1 つ以上の特定のジョブを選択します。ジョブを直接選択するか、名前で検索して見つけることができます。

    Event Target

    通知チャネルを指定します。オプションには、DingTalkWeComLark音声通話SMSメールがあります。

通知ルールを作成すると、ジョブがルールをトリガーしたときに、指定された連絡先にシステムが自動的に通知を送信します。通知を受信したら、Deep Learning Containers (DLC) ページに移動して、ジョブが期待どおりに実行されていることを確認します。また、ジョブのモニタリングステータスとログを確認して、問題を調査することもできます。詳細については、「トレーニング詳細の表示」をご参照ください。

タイムアウトアラートルールの設定

特定のイベントタイプに対してタイムアウトルールを設定するには、次の手順に従います:

  1. Configure Workspace ページで、Configure Scheduling タブに切り替えます。DLC エリアで、ジョブの最大待機時間と最大実行時間のタイムアウトルールを設定します。image

    ポリシー

    説明

    Resource Quota

    特定のリソースを使用するジョブの最大待機時間を設定します:

    • Public Resource Group

    • Resource Quota:ワークスペースにバインドされているリソースクォータを選択します。

    Timeout Rule Configuration

    特定のイベントタイプのタイムアウト時間を設定します:

    • Job Wait Time (キュー時間 + 環境準備時間)

    • Queuing Time

    • Environment Preparation Time

    また、Add をクリックして、複数のタイムアウトルールを設定することもできます。

  2. パラメーターを設定した後、Save をクリックします。

Configure Event Notification タブに移動し、イベントタイプとして DLC Jobs を選択し、対応するタイムアウトイベント通知を設定します。通知を受信するには、ルールを設定する必要があります。詳細については、「通知ルールの設定」をご参照ください。