全部產品
Search
文件中心

DataWorks:AI營運

更新時間:Feb 04, 2026

DataWorks AI營運是一項由DataWorks Copilot驅動的營運能力,旨在為任務執行個體提供全面的健康評估與問題定位。通過融合依賴鏈路、資源水位、歷史運行趨勢、變更影響、日誌異常及資料品質等多維度分析,自動產生結構化的診斷報告。報告不僅能快速揭示問題根源,還提供具體解決方案和一鍵執行的快捷營運操作,旨在協助使用者從被動響應故障轉變為主動發現和預防問題,顯著提升營運效率。

功能介紹

AI營運是DataWorks提供的一站式、智能化的任務營運工具。是原智能營運功能的升級版本。當遇到任務失敗、運行變慢、等待資源等問題時,DataWorks AI營運能夠自動分析任務的全生命週期,快速定位問題根因,並提供解決方案和一鍵式營運操作。

image

核心能力

  • 全景診斷:覆蓋任務從未運行、等待、運行中到成功/失敗的每一種狀態。診斷範圍支援從單個執行個體、工作流程到整個專案空間,通過綜合分析依賴關係、資源使用、歷史效能及日誌內容,給出全面的診斷結論,並支援上下文追問。

  • 根因分析:不僅呈現錯誤記錄檔,更通過多維資訊關聯分析,深入定位問題的根本原因。

  • 互動式營運:支援在對話方塊中直接下達營運指令(如重跑、置成功、修改資源群組等),並將複雜操作簡化為一鍵式按鈕,顯著提升營運效率。

快速入門

本節將通過一個排查“執行個體運行失敗”的典型情境,引導您完成一次完整的智能營運流程。

  1. 發起診斷

    1. 進入營運中心 > 周期執行個體,找到運行失敗的目標執行個體。

    2. 點擊執行個體名稱,展開該執行個體的DAG圖片,將滑鼠移至上方在該執行個體上,在彈出的快捷操作欄中,點擊AI診斷按鈕。

      image

  2. 等待AI分析

    點擊後,頁面右側將自動喚起 DataWorks Copilot 助手,並顯示“DataWorks Copilot 正在處理中...”。在等待結果時,Copilot會顯示其正在執行的分析步驟。這有助於您理解AI的“思考”過程。以下是一個典型的診斷分析流程,您可以展開任意一項查看詳細資料

    image

    image

  3. 解讀診斷報告

    十幾秒後,Copilot會返回一份結構化的診斷報告。您應重點關注以下部分:

    • 異常發現:通過全方位分析,發現執行個體的異常,並根據上下文推導問題產生的根本原因,是您首先需要關注的結論。

    • 分析過程:詳細列出了AI得出結論的證據鏈,增加了結果的可信度。

    • 解決和預防建議:提供了具體、可操作的修複步驟和避免問題複發的長期建議。

    image

  4. 執行解決方案

    根據報告提供的建議進行操作。

    • 立即措施:報告通常會提供與問題直接相關的快捷操作。例如,對於資源群組問題,可能會提供修改任務資源群組的捷徑,如下圖所示,您可以直接回答:需要,由AI協助進行修改資源群組。

      image

      image

    • 互動式操作:如報告未提供具體操作,您也可以在對話方塊中繼續輸入指令來解決問題,例如輸入“修改任務xxx的資源群組”,Copilot會引導您完成操作。通過自然語言互動,AI能動態理解複雜上下文需求,降低操作門檻,適合非結構化營運情境。

      image

說明

不同的失敗原因返回的報告結果和解決預防建議各不相同,以實際情況為準,當前營運Agent支援的操作參見支援的營運操作

注意事項

  • 專案級診斷或執行個體數較多時,響應可能延遲 1–5 分鐘。

  • 支援跨工作空間依賴分析,但使用者需加入目標工作空間,才有許可權查看分析細節。

啟用AI診斷

DataWorks存在多個入口,可以使用AI營運。

全域入口(Copilot)

在DataWorks任意頁面,開啟右上方的Copilot對話方塊,切換Copilot至Agent,選擇/資料營運

image

可輸入:診斷執行個體 [執行個體ID]或通過@<執行個體ID>擷取上下文對目標發起診斷。

說明

在全域入口中,需要使用/資料營運來聲明需使用的Agent,但在情境化入口中無需聲明,預設即使用營運Agent。

情境化入口

頁面位置

操作方式

營運中心 > AI營運

在營運中心,單擊左側導覽列的AI營運。

營運中心 > 執行個體列表

點擊操作列更多 > AI診斷,支援診斷周期執行個體、測試執行個體、補資料執行個體。

營運中心 > DAG 圖

懸停節點執行個體 → 點擊hover的AI診斷 按鈕。

執行個體作業記錄頁簽

在日誌診斷介面,點擊頂部AI診斷按鈕(自動喚起 Copilot 並提交診斷指令)。

日誌診斷頁

在頁面中間的對話方塊中,啟用AI診斷,輸入執行個體 ID 或專案 ID,並進行診斷。

說明:原有的“智能診斷”按鈕已更名為“日誌診斷”,專註於對當前日誌內容的分析。

支援的診斷情境

執行個體級問題

問題類型

診斷指令樣本

任務失敗

診斷執行個體: <執行個體ID>或通過@<執行個體ID>擷取上下文。

運行變慢

為什麼執行個體 <執行個體ID> 今天變慢了?

長時間等待

查看執行個體 <執行個體ID> 為什麼一直在等待

依賴阻塞

查看執行個體 <執行個體ID> 失敗的父節點有哪些

支援的營運操作

在診斷報告或 Copilot 對話中,您可以單獨或批量對空間下的任務或執行個體執行以下操作:

重要

AI對話方塊中執行的任何操作,均需要人為審核授權確認後才會執行。

操作

說明

重跑執行個體

重新運行當前執行個體

置成功

強制標記為成功

暫停/恢複執行個體

控制調度狀態

修改資源群組

切換資源群組

修改優先順序

調整調度優先順序(影響基準調度)

重新整理執行個體

重新整理執行個體的配置資訊至最新內容

使用者需具備目標工作空間的 專案系統管理員(Project Owner) 或 營運(O&M) 角色許可權。