Platform for AI (PAI) ワークスペースの通知ルールを作成して、Deep Learning Containers (DLC) ジョブのステータスを追跡および監視できます。このトピックでは、通知ルールを設定する方法について説明します。
通知ルールを設定する
[ワークスペースの詳細] ページ(新バージョン)で、 を選択します。次に、[イベントルールの作成] をクリックします。

[イベントルールの作成] パネルで、次のパラメーターを設定し、[送信] をクリックします。

パラメーター
説明
ルール名
画面の指示に従ってルール名を指定します。
イベントタイプ
[イベントタイプ] で [DLC ジョブ] を選択します。次に、以下のいずれかを選択します。
ジョブプロセス
キューに入りました: ジョブがキューイング状態になります。
入札開始: ジョブが入札状態になります。
環境準備開始: ジョブが環境準備状態になります。
実行開始: ジョブが実行状態になります。
成功時に保持: ジョブが成功時に保持状態になります。
失敗時に保持: ジョブが失敗時に保持状態になります。
ジョブ失敗: ジョブの実行に失敗しました。
ジョブ完了(成功または失敗): ジョブが成功または失敗しました。
自動フォールトトレランス: DLC ジョブが例外またはエラーに遭遇し、自動フォールトトレランス処理を実行すると、通知が送信されます。
ジョブタイムアウト: このオプションを選択する場合は、まずワークスペースのスケジューリング設定ページでタイムアウトルールを設定する必要があります。詳細については、「タイムアウトルールを設定する」をご参照ください。
キュータイムアウト: キュー時間 > 指定された最大キュー時間。
環境準備タイムアウト: 環境準備時間 > 指定された最大準備時間。
待機タイムアウト: ジョブの作成から実行までの待機時間 > 指定された最大待機時間。
実行タイムアウト: ジョブの実行時間 > 指定された最大実行時間となり、自動停止がトリガーされます。
その他のイベント
ジョブプリエンプト: アイドル状態のジョブまたは入札ジョブがプリエンプトされると、通知が送信されます。
ジョブを手動で停止
ジョブの優先度を変更
イベントスコープ
有効な値:
自分が作成: 自分自身で作成した DLC ジョブのみ。
現在のワークスペース: 現在のワークスペース内のすべての DLC ジョブ。
イベントターゲット
通知は DingTalk、WeCom、および Lark を介して送信できます。
通知ルールを作成すると、ジョブがルールをアクティブにしたときに、システムは指定された連絡先にアラートを自動的に送信します。 [Deep Learning Containers (DLC)] ページにアクセスして、ジョブが想定どおりに実行されているかどうかを確認することをお勧めします。詳細なトラブルシューティングについては、ジョブの監視ステータスとログを参照してください。詳細については、「トレーニングジョブを表示する」をご参照ください。
タイムアウトルールを設定する
特定のイベントタイプのタイムアウトルールを設定するには、次の手順に従います。
[ワークスペースの設定] ページに移動し、[DataWorks スケジューリング設定] タブを選択します。次に、[DLC] セクションで、最大実行時間と最大ジョブ待機時間を設定します。

ポリシー
説明
リソースクォータ
指定されたリソースを使用するジョブの最大待機時間を設定します。有効な値:
パブリックリソースグループ
リソースクォータ: このワークスペースに関連付けられているリソースクォータを選択します。
タイムアウトルール設定
指定されたイベントタイプのタイムアウト時間を設定します。有効な値:
ジョブ待機時間(キュー時間 + 環境準備時間)
キュー時間
環境準備時間
複数のタイムアウトルールを追加するには、[追加] をクリックします。
[保存] をクリックします。
次に、[イベント通知の設定] タブに移動して、対応するタイムアウトルールを設定します。そうしないと、アラートは送信されません。詳細については、「通知ルールを設定する」をご参照ください。