您可以在PAI工作空間的事件通知配置中建立訊息通知規則,以便追蹤和監控DLC任務的狀態。本文為您介紹如何使用訊息通知功能。
配置訊息通知
在工作空間詳情頁面,選擇,然後單擊建立事件規則。

在建立事件規則配置面板,配置以下參數,然後單擊提交。

參數
描述
規則名稱
根據介面提示資訊,自訂規則名稱。
事件類型
事件來源選擇DLC任務。支援發送訊息通知的事件類型如下:
任務進程
進入排隊:任務進入排隊中狀態。
開始競價:任務進入競價中狀態。
開始環境準備:任務進入環境準備中狀態。
開始運行:任務進入運行中狀態。
任務成功保留:任務進入成功保留狀態。
任務失敗保留:任務進入失敗保留狀態。
任務失敗:任務執行失敗。
任務結束(包含成功和失敗):任務執行成功或失敗。
任務自動容錯:當DLC任務發生異常或錯誤並進行自動容錯處理時,發送訊息通知。
任務逾時:若選擇此項,請先在對應工作空間的調度配置頁面,設定逾時規則,具體參考配置逾時警示規則。
排隊逾時:任務排隊時間長度>設定的最大排隊時間長度。
環境準備逾時:任務環境準備時間長度>設定的最大準備時間長度。
等待逾時:任務建立至運行前的等待時間長度>設定的最大等待時間長度。
運行逾時:任務運行時間長度>設定的最大運行時間長度,觸發自動停止。
其他事件
任務被搶佔:當閑時任務或競價任務被搶佔時,會發送訊息通知。
任務被手動停止
任務優先順序被調整
事件範圍
支援以下取值:
我建立的:僅您自己建立的DLC任務。
當前工作空間所有的:當前工作空間下的所有的DLC任務。
事件目標
支援通過DingTalk通知、企業微信通知、飛書通知、語音電話、簡訊及郵件等方式進行訊息提醒。
通知規則建立成功後,當任務觸發對應規則時,系統會自動向預設的連絡人發送訊息通知。收到通知後,建議您前往分布式訓練(DLC)頁面,觀察任務是否符合預期,也可以通過任務監控狀態、日誌資訊排查具體原因,詳情請參見查看訓練詳情。
配置逾時警示規則
為指定事件類型配置逾時規則,具體操作步驟如下:
在工作空間配置頁面,切換到調度配置頁簽,在DLC地區配置任務最大等待時間長度、最大運行時間長度的逾時規則。

策略
描述
資源配額
支援為使用指定資源的任務配置最大等待時間長度,取值如下:
公用資源群組
資源配額:選擇該工作空間已綁定的資源配額。
逾時規則配置
為指定事件類型設定逾時時間。支援配置的事件類型如下:
任務等待時間長度(排隊時間長度+環境準備時間長度)
排隊時間長度
環境準備時間長度
您也可以單擊添加按鈕,配置多條逾時規則。
參數設定完成後,單擊儲存。
請前往事件通知配置選擇DLC任務類型,配置對應的逾時事件通知。若未配置,則不會收到通知。具體操作,請參見配置訊息通知。