DataWorks Agent智能體基於自然語言互動,結合大模型的深度認知與規劃能力,能夠完成複雜的Data Integration、開發及治理任務,實現從需求到成果的端到端自動化,大幅提升工作效率。本文將針對Copilot Agent智能體的功能情境以及核心特性等進行詳細介紹。
功能概述
DataWorks Agent智能體基於自研Agent用戶端實現,與依賴第三方用戶端的基於三方用戶端的DataWorks Agent實現方式不同,您無需安裝額外軟體或進行繁瑣配置,在 DataWorks相應模組頁面即可直接使用。
通過說需求,得成果的自然語言互動方式,DataWorks Agent實現了需求即代碼的開發體驗。您只需用自然語言描述需求,即可完成資料開發等工作,從而顯著提升工作效率。DataWorks Agent 運行流程如下:
功能入口
登入 DataWorks控制台,點擊左側菜單,選擇對應工作空間後點擊進入資料開發(Data Studio)。
單擊Data Studio頁面頂部導覽列右上方的
,進入Copilot Chat,預設啟用Ask模式,在對話方塊左下角,切換至Agent模式。
快速開始
步驟1:進入Copilot chat,切換至Agent模式
在Data Studio頁面,單擊頂部導覽列右上方的
,進入Copilot Chat,在對話方塊左下角,切換至Agent模式。
步驟2:選擇Agent
您可以單擊/或在輸入框中輸入/快速喚起 Agent 菜單,選擇適用於當前任務情境的專用Agent。Agent類型包括:Data IntegrationAgent,資料地圖Agent,資料開發Agent,資料治理Agent,資料營運Agent。
在對應產品模組下,DataWorks 會預設使用匹配的 Agent,無需您手動選擇或指定。

步驟3:添加上下文(可選)
您可以通過在對話方塊中輸入@或在對話方塊右下角單擊@選擇並添加所需的上下文類型,從而為 Copilot 提供更豐富的背景資訊。

所支援的類型有:
表:引用一張或多張表的中繼資料資訊。
節點/代碼檔案:如引用某個節點中的代碼。
資料專輯:引用資料地圖中的資料專輯。
Rules:臨時指定某個或某幾個Rules對目前的交談生效。
本地檔案:上傳本地的文檔作為背景資訊。
步驟4:切換大模型(可選)
Copilot 預設採用 Auto 模式。在此模式下,Agent 將根據任務情境執行智能化模型調度與全自動分配,並支援多模型間的無縫切換。更多詳情,請參閱:4. 智能化模型調度。同時,您可以單擊對話方塊底部的
表徵圖,在彈出的菜單中自主選擇其他所支援的大模型。

支援的模型有:
模型類型 | 支援地區 |
Auto | 華東1(杭州)、華東2(上海)、華北2(北京)、華北3(張家口)、華北6(烏蘭察布)、華南1(深圳)、西南1(成都)、中國香港、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、日本(東京)。 |
Qwen3-Coder | 華東1(杭州)、華東2(上海)、華北2(北京)、華北3(張家口)、華北6(烏蘭察布)、華南1(深圳)、西南1(成都)、中國香港、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、日本(東京)。 |
Qwen3-Max | 華東1(杭州)、華東2(上海)、華北2(北京)、華北3(張家口)、華北6(烏蘭察布)、華南1(深圳)、西南1(成都)。 |
GLM4.7 | 華東1(杭州)、華東2(上海)、華北2(北京)、華北3(張家口)、華北6(烏蘭察布)、華南1(深圳)、西南1(成都)。 |
步驟5:提交問題並可多輪對話
在對話方塊中輸入您的需求,您可以通過連續追問或補充說明的方式進行多輪對話,逐步修正和細化您的意圖,直至 Agent 完全理解併產出您期望的結果。
核心情境
藉助大模型深度理解與任務編排能力,DataWorks Agent 覆蓋Data Integration、開發、治理、地圖、營運等情境。具體能力對比如下表所示。
Agent情境 | 功能描述 |
Data Integration | 支援使用者以自然語言方式(如中文或英文)直接描述資料同步需求,系統即可自動解析語義,智能產生對應的資料同步任務配置,包括源端與目標端的資料來源類型、表結構映射、欄位過濾條件、分區策略及調度參數等。 |
資料開發 | 提供基於自然語言的ETL開發體驗,覆蓋需求分析、代碼產生、工作流程產生到發起發布的全流程。 |
資料治理 | DataWorks資料治理Agent,驅動企業資料治理從主動式邁向“自主式”資料治理。資料治理不再是複雜的資料分析和大量的表單配置修改,現在只需通過自然語言指令,轉化為精準的治理動作,通過專家級的治理能力進行治理操作的設定,並可進行自動執行。 |
資料地圖 | 專註於提升資料尋找與理解的效率。通過AI驅動的自然語言互動,您可以在海量資料中快速完成中繼資料多種情境下的探索。 |
資料營運 | 旨在為任務執行個體提供全面的健康評估與問題定位。通過融合依賴鏈路、資源水位、歷史運行趨勢、變更影響、日誌異常及資料品質等多維度分析,自動產生結構化的診斷報告。 |
情境1 - Data IntegrationAgent
功能描述:支援使用者以自然語言方式(如中文或英文)直接描述資料同步需求,系統即可自動解析語義,智能產生對應的資料同步任務配置,包括源端與目標端的資料來源類型、表結構映射、欄位過濾條件、分區策略及調度參數等。
操作步驟:
在對話方塊中輸入
/並選擇Data IntegrationAgent。描述您的資料同步需求,包括源端、目標端、表名以及同步方式等。例如:“幫我建立一個離線同步任務,把MySQL的
ods_user_info_d表同步到MaxCompute的ods_user_info_d表”Agent 會解析您的需求,並自動填滿資料來源、表映射等資訊來建立資料同步節點。
建立完成後,您可以點擊查看與修改。
情境2 - 資料開發Agent
功能描述:提供基於自然語言的ETL開發體驗,覆蓋需求分析、代碼產生、工作流程產生到發起發布的全流程。
操作步驟:
使用自然語言描述您的資料開發需求,並可按需添加上下文。例如:“構建使用者Portrait analysis工作流程”。
Agent 會將任務分解為多個步驟(如建立節點、產生代碼、配置依賴)執行。
針對產生的節點代碼,您可以查看並選擇是否保留或撤銷。
情境3 - 資料治理Agent
功能描述:DataWorks資料治理Agent,驅動企業資料治理從主動式邁向“自主式”資料治理。資料治理不再是複雜的資料分析和大量的表單配置修改,現在只需通過自然語言指令,轉化為精準的治理動作,通過專家級的治理能力進行治理操作的設定,並可進行自動執行。
核心能力:
品質規則配置:通過自然語言,協助使用者對指定的重點表,自動設定品質監控規則;資料治理Agent可智能分析指定表的欄位類型、業務語義和重要性,自動推薦並配置合理監控規則,如主鍵唯一性、非空約束、枚舉值範圍校正等,高效完成以往需要多次探查資料和規則配置的工作。
樣本:幫我針對
dim_user_info這張核心使用者維表,自動產生品質規則。樣本:針對
ods_開頭的表,自動設定錶行數相關品質規則。
品質問題治理:針對資料資產治理模組中,已由系統自動探索的待治理的品質問題,如“熱門訪問表未配置品質規則”,“高基準任務產出表未配置品質規則”等問題,可直接通過自然語言給出治理要求,系統自動分析問題並進行相應治理
樣本:找出熱門訪問表未配置品質規則的表,推薦並配置品質規則。
樣本:幫我治理品質維度問題。
情境4 - 資料地圖Agent
功能描述:專註於提升資料尋找與理解的效率。通過AI驅動的自然語言互動,您可以在海量資料中快速完成中繼資料多種情境下的探索。
核心能力:
自然語言搜尋:支援自然語言問答,無需精確關鍵詞,基於業務意圖即可快速定位目標資料。例如,“找一下和使用者活躍度相關的匯總表”。
自動範圍調整:支援在對話中指定範圍,Agent將自動理解語義,快速基於該範圍進行資料定位。例如,“在adm_bi專案下,尋找和業務經營相關的表”。
深度資料理解:支援對目標資料進行追問,快速擷取血緣、負責人、欄位釋義等詳細資料。例如,“@dws_bi_metric_di這張表的直接下遊有哪些?如果變動後會對哪些負責人有影響?”。
情境5 - 資料營運Agent
功能描述:旨在為任務執行個體提供全面的健康評估與問題定位。通過融合依賴鏈路、資源水位、歷史運行趨勢、變更影響、日誌異常及資料品質等多維度分析,自動產生結構化的診斷報告。
關於更多資料營運Agent的說明,可以參見:AI營運。
核心機制解析
1. 儲存管理
資料開發 Agent 支援在專案目錄或個人目錄中建立節點與檔案。為了保障儲存管理的準確性:
儲存位置設定:在Copilot設定中心中配置生成代碼檔案的預設儲存路徑,詳情可參見:個人設定。
衝突處理機制:當產生的節點類型與目前的目錄規則不一致時(例如:使用者請求在個人目錄下建立Data Integration節點),Agent 會觸發二次確認流程,待使用者核實後繼續執行。
2. 複雜任務處理
針對邏輯較複雜的開發需求,Agent 提供了全生命週期的狀態反饋:
待辦事項清單:Agent 會將複雜任務拆解為多個子步驟並展示待辦事項清單。隨著執行的推進,各事項狀態將自動更新。

執行總結:在任務流結束階段,Agent 會整理並輸出整個任務的總結報告,匯總已完成的操作及產生的資源,提升複核效率。
3. Token 消耗與效能統計
任務執行完成後,Agent 會提供量化的指標反饋,協助您直觀評估執行效率與模型調用規模:
任務耗時統計:系統自動記錄並展示當前任務從啟動到結束的總耗時,方便您評估自動化處理的效能。
Token 消耗計量:精確統計本次互動產生的輸入 Token 與輸出 Token 數量。

4. 智能化模型調度
Copilot 引入了智能模型分配機制,旨在實現“意圖驅動”的開發體驗,您無需再關注底層模型的選型:
全自動模型分配(Auto 模式):Agent 預設為 Auto 模式。在此模式下,Agent 會深度識別並精準拆解使用者的開發意圖,針對不同的子任務自動調度最優模型進行處理。
多模型動態協同(Auto 模式):在Auto模式下,Agent 具備跨模型調度能力。系統會根據任務的即時需求,在單次對話中靈活切換多個模型,確保複雜任務的每一個環節都能匹配到更適合的模型。
自主切換模型:在滿足自動化需求的同時,若您有特定情境需求,可從 Auto 模式切換並指定其他特定的模型進行任務處理。
相關文檔
瞭解定製化Agent功能,詳情請參見基於三方用戶端的DataWorks Agent。