告別繁瑣的資料“體力活”,DataWorks 內建更懂你的 AI 助手—DataWorks Copilot。DataWorks Copilot 致力於將您從重複、低效的工作中解放出來,把寶貴的時間還給創新與思考;讓資料開發,重歸簡單高效。它深度整合於DataWorks,只需通過自然語言下達指令,Copilot 就能為您:
代碼編程:將想法即時轉化為高品質、正常化的代碼。
自動建立任務:智能完成資料開發與治理相關任務,讓流程自動化。
沉澱團隊智慧:將最佳實務和業務知識作為上下文融入每一次思考。
一、功能概述
什麼是DataWorks Copilot
DataWorks Copilot,作為一站式智能資料開發治理平台 DataWorks 的智能助手,藉助AI推理和自然語言處理能力,在代碼開發情境下,協助開發人員根據自然語言快速完成多種代碼相關操作,包括 SQL/Python 代碼的產生、續寫、改寫、最佳化、解釋及代碼錯誤修正/測試案例產生等功能。作為資料開發的智能引擎,能夠根據上下文快速理解業務需求,在企業專屬領域知識庫的加持下,DataWorks Copilot讓開發人員能夠輕鬆、高效、便捷地完成資料ETL及資料分析工作,節省時間和精力。
DataWorks Copilot 包含Agent智能體、代碼編程助手和快捷AI操作三大核心能力,深度融合於DataWorks的各個產品模組中,為您帶來全新的智能化資料工作體驗。
核心價值
提升效率:通過代碼自動產生、智能補全、自然語言互動等方式,大幅縮短資料開發和分析的周期。
降低門檻:讓不熟悉複雜SQL或產品操作的使用者,也能通過自然語言快速上手,完成資料開發治理任務。
保障品質:利用AI進行代碼錯誤修正、最佳化和測試案例產生,提升代碼品質和可維護性。
知識沉澱:通過自訂企業知識庫,將企業規範、業務口徑、技術標準融入AI,實現知識的傳承與應用。
開放地區與策略
開放對象:DataWorks 基礎版及以上規格的客戶。部分功能僅限新版資料開發Data Studio可用。
開放地區:華北3(張家口)、華北2(北京)、華北6(烏蘭察布)、華東1(杭州)、華東2(上海)、華南1(深圳)、西南1(成都)、中國香港、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、日本(東京)。
當前階段:全面公測。由主帳號、租用戶系統管理員或同等許可權的使用者,點擊Copilot,仔細閱讀《DataWorks Copilot服務合約》後,點擊“確認參加”即可。確認,該主帳號下的所有使用者即可開啟Copilot的使用。
費用說明:公測期間,DataWorks Copilot 完全免費。公測結束後將轉為正式的付費服務,具體收費模式將另行公布。
二、快速入門
如何喚起Copilot
您可以通過以下方式與Copilot進行互動:
全域入口:點擊DataWorks介面頂部右側的Copilot表徵圖,即可開啟Copilot Chat交談視窗。
編輯器內:在代碼類資料開發節點的智能代碼編輯器中,通過右鍵菜單或快速鍵喚起。
模組內嵌:在特定產品模組的功能區域,帶有Copilot標識的快捷操作按鈕。
主要互動介面概覽

三、核心功能詳解
Agent智能體:自動化完成複雜任務
功能概述
DataWorks Agent 服務,引領資料開發與治理進入全新的自動化時代。它不再局限於問答,而是化身為一個能夠自主完成複雜任務的智能體。
使用DataWorks Agent,可以通過自然語言互動來自動化完成DataWorks上資料開發、資料治理的部分任務,例如Data Integration、資料開發、資料地圖、資料治理等。通過大模型的深度思考及規劃能力,Agent可以充分理解使用者的任務,對任務進行步驟分解並制定執行計畫,並調用MCP Server中的相關工具來自動化執行任務。DataWorks將持續豐富和迭代DataWorks MCP Server中的工具集,致力於為使用者提供更加智能和高效的資料開發治理產品體驗。
核心功能亮點
深度理解與自主規劃:基於上下文感知與多輪對話,準確識別複雜意圖,自主將任務分解為可執行檔多步驟計劃。
資料開發治理過程自動化:深度融合DataWorks核心產品能力與流程,全面打通上下文資料,內建DataWorks工具集。
功能入口
在Copilot Chat對話方塊中,從Ask模式切換至Agent模式。
根據您的任務類型,輸入
/選擇合適的Agent類型。通過提問方式,向Agent下達指令。

最佳實務情境
情境1 - 資料開發Agent
功能描述:提供基於自然語言的ETL開發體驗,覆蓋需求分析、代碼產生、工作流程產生到發起發布的全流程。
情境2 - 資料地圖Agent
功能描述:專註於提升資料尋找與理解的效率。通過AI驅動的自然語言互動,您可以在海量資料中快速完成中繼資料多種情境下的探索。
核心能力:
自然語言搜尋:支援自然語言問答,無需精確關鍵詞,基於業務意圖即可快速定位目標資料。例如,“找一下和使用者活躍度相關的匯總表”。
自動範圍調整:支援在對話中指定範圍,Agent將自動理解語義,快速基於該範圍進行資料定位。例如,“在adm_bi專案下,尋找和業務經營相關的表”。
深度資料理解:支援對目標資料進行追問,快速擷取血緣、負責人、欄位釋義等詳細資料。例如,“@dws_bi_metric_di這張表的直接下遊有哪些?如果變動後會對哪些負責人有影響?”。
情境3 - 資料治理Agent
功能描述:DataWorks資料治理Agent,驅動企業資料治理從主動式邁向“自主式”資料治理。資料治理不再是複雜的資料分析和大量的表單配置修改,現在只需通過自然語言指令,轉化為精準的治理動作,通過專家級的治理能力進行治理操作的設定,並可進行自動執行。
核心能力:
品質規則配置:通過自然語言,協助使用者對指定的重點表,自動設定品質監控規則;資料治理Agent可智能分析指定表的欄位類型、業務語義和重要性,自動推薦並配置合理監控規則,如主鍵唯一性、非空約束、枚舉值範圍校正等,高效完成以往需要多次探查資料和規則配置的工作。
樣本:幫我針對
dim_user_info這張核心使用者維表,自動產生品質規則。樣本:針對
ods_開頭的表,自動設定錶行數相關品質規則。
品質問題治理:針對資料資產治理模組中,已由系統自動探索的待治理的品質問題,如“熱門訪問表未配置品質規則”,“高基準任務產出表未配置品質規則”等問題,可直接通過自然語言給出治理要求,系統自動分析問題並進行相應治理
樣本:找出熱門訪問表未配置品質規則的表,推薦並配置品質規則。
樣本:幫我治理品質維度問題。
代碼編程助手:提升編碼效率與品質
功能概述
DataWorks Copilot 智能編程助手基於先進的大語言模型,通過自然語言互動,能高效完成SQL/Python代碼的產生、最佳化、解釋和測試等任務。為確保最佳效果,您可以在DataWorks預設模型、通義千問及DeepSeek等多種的模型間自由切換,從而顯著提升ETL開發與資料分析的效率。
核心功能亮點
多模型自由切換:支援預設模型、Qwen3-235B-A22B等。
ETL全鏈路支援:支援SQL和Python語言的代碼產生/問答/改寫/最佳化/錯誤修正/注釋/測試案例產生/解釋等。
上下文感知:理解對話內容、代碼、表結構、資料血緣、自訂知識庫等。
功能入口
智能代碼編輯器
情境一:智能代碼補全
使用方法:在您進行代碼類節點開發時,Copilot會根據上下文(已輸入的代碼、引用的表結構等)智能預測並推薦後續程式碼片段,補全建議會自動出現,按Tab鍵採納。
情境二:右鍵菜單快捷操作
使用方法:在智能代碼編輯器中,按需選中代碼,單擊滑鼠右鍵,在彈出的菜單中選擇Copilot。

Copilot Chat(Ask模式)
Ask模式是Copilot Chat的預設模式,適用於以問答形式解決具體的編碼問題。支援使用者完成代碼產生、代碼改寫、代碼錯誤修正、產生注釋、代碼解釋、代碼最佳化、代碼測試、代碼問答、 Notebook Cell 智能生快捷找表。使用Copilot Chat Ask模式時,支援選中編輯器中的代碼作為上下文,進行針對性的操作。

最佳實務情境
情境1 - 快速產生ETL指令碼
功能描述:您可通過自然語言表達您的業務需求,DataWorks Copilot會將自然語言指令自動轉換成SQL/Python語句。
樣本:"基於dwd_ec_trd_create_ord_di表,統計2024年9月1日至2024年9月18日每個spu的銷售額、銷量、sku數量、買家數量、賣家數量"。
情境2 - 基於已有程式碼片段繼續產生代碼
功能描述:DataWorks Copilot代碼補全能力,可對您正在編寫的SQL進行智能代碼補全。
樣本:無需指令,自動產生,根據介面提示按鍵接受即可。

情境3 - 對已有代碼進行改寫
功能描述:您可通過自然語言對已有代碼進行修改,只需要用自然語言說出您的要求,DataWorks Copilot就會對指定的代碼進行改寫。
樣本:"修改sql,將其結果從列轉置為行,使用unpivot實現"。
情境4 - 快速排查代碼中存在的錯誤並修正
功能描述:在DataWorks中,在代碼執行前,您可以主動對已有代碼進行錯誤檢查;在代碼運行出錯後,也可以通過一鍵錯誤修正,發起對代碼錯誤的糾正。DataWorks Copilot會告訴您當前代碼運行出錯的原因以及修正後的代碼。
樣本:選中代碼後右鍵,選擇快捷指令即可。
情境5 - 解釋一段代碼的業務含義
功能描述:DataWorks Copilot可對您指定的代碼內容進行解釋,提升代碼的可讀性,方便您快速學習和理解代碼。
樣本:"解釋一下這段SQL"。
情境6 - 為已有代碼產生欄位注釋
功能描述:DataWorks Copilot可以對指定的代碼產生注釋,提升代碼的完整性及可讀性。
樣本:"為每個欄位添加註釋"。
情境7 - 解答對於SQL文法或者函數的用法
功能描述:您可以用自然語言提出對SQL文法或者MaxCompute函數的相關問題,DataWorks Copilot會給出解釋和用法樣本,協助您加深對SQL文法及函數的理解。
樣本:"MaxCompute中的mapjoin怎麼寫"。
情境8 - 對已有代碼進行效能最佳化
功能描述:在DataWorks Copilot Chat視窗中,您可以對指定的代碼發起SQL最佳化,如引入JOIN結合多表等方式簡化代碼邏輯,提升代碼運行效率,一定程度降低資料庫的負載。
樣本:選中代碼後,在對話方塊中使用快捷指令。
情境9 - 對已有代碼產生測試案例
功能描述:在DataWorks Copilot Chat視窗中,您可以對指定的代碼產生測試案例。DataWorks Copilot會為您產生完整的代碼測試報告,包含單元測試、代碼效能、邊界條件驗證等多角度,並產生測試代碼,您可據此逐步驗證任務代碼的每個部分是否按預期工作。
樣本:"產生SQL測試案例並講解測試步驟"。
快捷AI操作:簡化產品模組內操作
DataWorks資料開發/營運/品質等模組通過利用大模型的能力,提供便捷智能化產品操作,希望能為開發人員和企業使用者提供智能化產品體驗,以高效完成 DataWorks 產品操作。
查詢結果智能可視化
功能描述:在DataWorks-資料開發/資料分析中,藉助DataWorks Copilot智能圖表助手,您可一鍵產生基於查詢結果的可視化圖表及資料見解。
使用入口:在節點運行或SQL查詢結果處,切換至可視化頁簽。

AI智能建表
功能描述:在Data Studio資料目錄中,藉助DataWorks Copilot建表助手,只需輸入表名關鍵字即可完成表的建立。也可一鍵觸發,智能推薦欄位名稱和欄位描述的補全。
使用入口:

任務發布描述產生
功能描述:在Data Studio中,在發布環節,藉助DataWorks Copilot發布助手,您可一鍵產生上線發布描述,提高發布效率。
使用入口:

任務異常智能診斷
功能描述:DataWorks營運中心的智能診斷正式對接Qwen、DeepSeek-R1(671B)模型。當任務運行異常時,您只需點擊運行診斷,大模型即可秒級提取日誌中的關鍵資訊、提供錯誤分析、解決建議,並推薦錯誤修複的快捷操作,讓AI成為您的營運。
使用入口:在營運中心頁面,單擊左側導覽列,進入周期執行個體頁面。單擊運行失敗執行個體,選中運行失敗節點,單擊右下角的運行診斷即可對任務進行智能診斷。
資料品質規則智能推薦
功能描述:使用者可以通過一鍵喚起Copilot的能力,基於DataWorks中完整的中繼資料資訊,快速產生適用於特定資料表或業務情境的資料品質規則,支援多種資料來源類型及多維度品質校正。
使用入口:在資料品質頁面,單擊左側導覽列,進入按表配置規則頁面。選擇目標表,單擊右側的建立品質監控,進入該表的品質規則配置。

資料服務API
功能描述:DataWorks資料服務能夠藉助Copilot智能助手進行快捷API封裝,根據業務需求一鍵產生SQL指令碼並自動解析為API的請求參數和返回參數。
使用入口:在資料服務模組中,建立產生API並選擇指令碼模式。

四、進階功能與最佳實務
提升回答準確性:為Copilot提供精準“記憶”
為了讓Copilot的回答更貼合您的企業規範和業務情境,我們強烈建議您為其提供精準的知識。
自訂知識(Rules)
功能描述:Rules是您為Copilot定義的一系列規則、規範和背景知識,它會指導Copilot的思考和回答。
設定入口:在Copilot Chat對話方塊右上方,點擊
表徵圖,進入Rules配置頁面。企業級Rules與個人級Rules:
企業級Rules:由管理員統一配置,支援設定生效範圍。適用於定義公司級的業務術語、編碼規範等。
個人級Rules:由使用者個人配置,僅對自己生效。適用於定義個人偏好、常用程式碼片段等。

在對話中指定上下文(Context)
功能描述:在每一次對話中,您可以手動指定與當前任務相關的上下文,讓Copilot聚焦於這些資訊進行回答,從而獲得更精準的結果。
支援的上下文類型:
表:引用一張或多張表的中繼資料資訊。
節點/代碼檔案:如引用某個節點中的代碼。
資料專輯:引用資料地圖中的資料專輯。
Rules:臨時指定某個或某幾個Rules對目前的交談生效。
本地檔案:上傳本地的文檔作為背景資訊。
如何引用上下文:在Copilot Chat輸入框中,輸入
@或者單擊+,即可彈出上下文選取器進行添加。
管理您的對話
查看對話歷史
Copilot會自動記錄您最近的對話。
記錄範圍:支援查看最近7天內,最多100個對話記錄。
查看入口:在Copilot Chat視窗頂部右側的“歷史會話”。
實踐建議:為不同任務開啟新對話
我們強烈建議您為每一個獨立的任務開啟一個新的對話(New Chat)。
原因:這樣可以避免不同任務的上下文互相干擾,讓Copilot更專註於當前任務,從而保證回答的準確性和相關性。
五、常見問題(FAQ)
Q: 為什麼Copilot的回答不準確或不符合我的預期?
A: 可能是因為缺乏足夠的上下文。請嘗試使用在對話中指定上下文(Context)中描述的方法,為Copilot提供更精確的背景資訊。
Q: Ask模式和Agent模式有什麼區別?我該如何選擇?
A: Ask模式適用於一問一答式的簡單任務,如產生一段代碼、解釋一個函數。
Agent模式適用於需要多個步驟、調用多種工具的複雜任務。