DataWorks AI營運是一項由DataWorks Copilot驅動的營運能力,旨在為任務執行個體提供全面的健康評估與問題定位。通過融合依賴鏈路、資源水位、歷史運行趨勢、變更影響、日誌異常及資料品質等多維度分析,自動產生結構化的診斷報告。報告不僅能快速揭示問題根源,還提供具體解決方案和一鍵執行的快捷營運操作,旨在協助使用者從被動響應故障轉變為主動發現和預防問題,顯著提升營運效率。
功能介紹
AI營運是DataWorks提供的一站式、智能化的任務營運工具。是原智能營運功能的升級版本。當遇到任務失敗、運行變慢、等待資源等問題時,DataWorks AI營運能夠自動分析任務的全生命週期,快速定位問題根因,並提供解決方案和一鍵式營運操作。

核心能力:
全景診斷:覆蓋任務從未運行、等待、運行中到成功/失敗的每一種狀態。診斷範圍支援從單個執行個體、工作流程到整個專案空間,通過綜合分析依賴關係、資源使用、歷史效能及日誌內容,給出全面的診斷結論,並支援上下文追問。
根因分析:不僅呈現錯誤記錄檔,更通過多維資訊關聯分析,深入定位問題的根本原因。
互動式營運:支援在對話方塊中直接下達營運指令(如重跑、置成功、修改資源群組等),並將複雜操作簡化為一鍵式按鈕,顯著提升營運效率。
快速入門
本節將通過一個排查“執行個體運行失敗”的典型情境,引導您完成一次完整的智能營運流程。
發起診斷
進入,找到運行失敗的目標執行個體。
點擊執行個體名稱,展開該執行個體的DAG圖片,將滑鼠移至上方在該執行個體上,在彈出的快捷操作欄中,點擊AI診斷按鈕。

等待AI分析
點擊後,頁面右側將自動喚起 DataWorks Copilot 助手,並顯示“DataWorks Copilot 正在處理中...”。在等待結果時,Copilot會顯示其正在執行的分析步驟。這有助於您理解AI的“思考”過程。以下是一個典型的診斷分析流程,您可以展開任意一項查看詳細資料


解讀診斷報告
十幾秒後,Copilot會返回一份結構化的診斷報告。您應重點關注以下部分:
異常發現:通過全方位分析,發現執行個體的異常,並根據上下文推導問題產生的根本原因,是您首先需要關注的結論。
分析過程:詳細列出了AI得出結論的證據鏈,增加了結果的可信度。
解決和預防建議:提供了具體、可操作的修複步驟和避免問題複發的長期建議。

執行解決方案
根據報告提供的建議進行操作。
立即措施:報告通常會提供與問題直接相關的快捷操作。例如,對於資源群組問題,可能會提供修改任務資源群組的捷徑,如下圖所示,您可以直接回答:
需要,由AI協助進行修改資源群組。

互動式操作:如報告未提供具體操作,您也可以在對話方塊中繼續輸入指令來解決問題,例如輸入“修改任務xxx的資源群組”,Copilot會引導您完成操作。通過自然語言互動,AI能動態理解複雜上下文需求,降低操作門檻,適合非結構化營運情境。

不同的失敗原因返回的報告結果和解決預防建議各不相同,以實際情況為準,當前營運Agent支援的操作參見支援的營運操作。
注意事項
專案級診斷或執行個體數較多時,響應可能延遲 1–5 分鐘。
支援跨工作空間依賴分析,但使用者需加入目標工作空間,才有許可權查看分析細節。
啟用AI診斷
DataWorks存在多個入口,可以使用AI營運。
全域入口(Copilot)
在DataWorks任意頁面,開啟右上方的Copilot對話方塊,切換Copilot至Agent,選擇/資料營運:

可輸入:診斷執行個體 [執行個體ID]或通過@<執行個體ID>擷取上下文對目標發起診斷。
在全域入口中,需要使用/資料營運來聲明需使用的Agent,但在情境化入口中無需聲明,預設即使用營運Agent。
情境化入口
頁面位置 | 操作方式 |
在營運中心,單擊左側導覽列的AI營運。 | |
營運中心 > 執行個體列表 | 點擊操作列,支援診斷周期執行個體、測試執行個體、補資料執行個體。 |
營運中心 > DAG 圖 | 懸停節點執行個體 → 點擊hover的AI診斷 按鈕。 |
執行個體作業記錄頁簽 | 在日誌診斷介面,點擊頂部AI診斷按鈕(自動喚起 Copilot 並提交診斷指令)。 |
日誌診斷頁 | 在頁面中間的對話方塊中,啟用AI診斷,輸入執行個體 ID 或專案 ID,並進行診斷。 |
說明:原有的“智能診斷”按鈕已更名為“日誌診斷”,專註於對當前日誌內容的分析。
支援的診斷情境
執行個體級問題
問題類型 | 診斷指令樣本 |
任務失敗 |
|
運行變慢 |
|
長時間等待 |
|
依賴阻塞 |
|
支援的營運操作
在診斷報告或 Copilot 對話中,您可以單獨或批量對空間下的任務或執行個體執行以下操作:
AI對話方塊中執行的任何操作,均需要人為審核授權確認後才會執行。
操作 | 說明 |
重跑執行個體 | 重新運行當前執行個體 |
置成功 | 強制標記為成功 |
暫停/恢複執行個體 | 控制調度狀態 |
修改資源群組 | 切換資源群組 |
修改優先順序 | 調整調度優先順序(影響基準調度) |
重新整理執行個體 | 重新整理執行個體的配置資訊至最新內容 |
使用者需具備目標工作空間的 專案系統管理員(Project Owner) 或 營運(O&M) 角色許可權。