DataWorks Agent基於MCP協議(模型上下文協議),可對接DataWorks MCP Server及其他巨量資料MCP Server(如Hologres MCP Server),旨在通過自然語言互動在DataWorks中實現資料開發、任務營運和Data Integration等能力。
該功能基於三方用戶端實現,若您希望體驗更便捷的Agent智能體服務,可參見DataWorks Agent。
功能介紹
DataWorks Agent支援通過自然語言互動方式,在智能交談視窗實現巨量資料開發。它的主要原理如下:DataWorks Agent通過大語言模型(LLM)解析需求,並智能調用MCP Server能力完成任務執行。
例如,您可通過DataWorks Agent交談視窗輸入“我有幾個工作空間”,Agent會通過LLM解析並調用內建DataWorks OpenAPI的DataWorks MCP Server提供的ListProjects工具查詢,並返回結果。當任務較複雜時,LLM將與MCP Server進行多次互動。
DataWorks Agent不僅整合DataWorks MCP Server,還支援接入其他MCP Server。您也可按需選擇自己的LLM(比如通義千問、DeepSeek、OpenAI等)。
您也可輸入如下提問,體驗更多DataWorks Agent支援的任務情境。
適用範圍 | 樣本提問 |
資料開發 | 【查詢任務】查詢本工作空間專案目錄下所有調度類型為暫停 |
【重新命名任務】幫我把上述節點的名字修改為:無效節點_待刪除,多個節點可以用序號來區分。 | |
【建立任務】幫我在本工作空間專案目錄下建立5個 | |
任務營運 | 【重跑失敗任務】查看本工作空間, |
【查詢失敗執行個體】查看本工作空間專案下, | |
【分析任務重跑屬性】分析這些任務的重跑屬性,是否可重跑,如可重跑,則重跑任務。 | |
Data Integration | 【同步MySQL單表至MaxCompute】請在當前工作空間中建立一個離線Data Integration任務:
|
【銷量分析】幫我分析order表這個月前10銷量商品的銷量走向。 |
使用限制
僅支援在已啟用新版資料開發的工作空間中,於個人開發環境中使用。
個人開發環境重啟後,需要重新安裝MCP Server功能,請謹慎操作。
計費說明
使用 DataWorks Agent 將產生以下費用:
DataWorks OpenAPI 呼叫費用
當 Agent 通過 MCP Server 調用 DataWorks OpenAPI 時,將按照OpenAPI計費標準收取相應費用。
LLM Token 費用
Agent 在解析使用者意圖、產生自然語言回複等過程中,需調用您配置的大模型(如通義千問等)。該過程將消耗模型輸入與輸出的 Token 數量,並依據所選模型服務商的計費規則進行計費。如使用百鍊中的
qwen-coder-plus模型時,費用將依據百鍊計費說明計算。
快速體驗DataWorks Agent
當您完成DataWorks Agent配置後,單擊 Cline 頁面右上方的
表徵圖,進入 DataWorks Agent 對話介面快速體驗:查詢當前工作空間的成員。
您只需輸入提問:查詢當前工作空間的成員。
Agent拆解步驟並運行:
需求解析與確認:Agent 解析使用者意圖(如“查詢當前工作空間成員”),自動識別需調用的
ListProjectMembers介面,並彈窗提示使用者確認目標工作空間(ProjectId)等必要參數。介面調用與響應:經使用者授權後,Agent 調用
ListProjectMembersOpenAPI,擷取並結構化返回該工作空間的成員列表(含角色、帳號類型等資訊)。更多關於ListProjectMembersOpenAPI的說明,可以參見:ListProjectMembers - 查詢工作空間成員列表。說明運行過程中,系統將提示您確認相關操作並擷取必要資訊。您可以單擊 Approve 同意執行,或單擊 Reject 拒絕該操作。
關鍵步驟的拆解邏輯可能因任務複雜度、LLM 選型及模型版本差異而略有不同,實際執行流程以當前會話中 Agent 的解析與互動為準。
配置DataWorks Agent
DataWorks Agent 通過 MCP 用戶端外掛程式(例如 Cline)構建前端對話介面,並通過 MCP Server 配置接入 DataWorks MCP Server等阿里雲MCP Server。
您可按需接入更多開源MCP Server,以增強 DataWorks Agent 的能力。
準備工作
已建立工作空間,並選擇使用新版資料開發(Data Studio)。
(可選,RAM帳號需要)進行任務開發的RAM帳號已被添加至對應工作空間中,並具有開發或空間管理員(許可權較大,謹慎添加)角色許可權,新增成員的操作詳情請參見為工作空間增加空間成員。
如果您使用的是主帳號,則可忽略該添加操作。
- 說明
如您的個人開發環境需要綁定VPC,您需配置個人開發環境訪問公網。
步驟一:進入個人開發環境
您可通過以下步驟,啟用並進入個人開發環境。
進入DataWorks工作空間列表頁,在頂部切換至目標地區,找到目標工作空間,單擊操作列的,進入Data Studio。
單擊頂部導覽列个人开发环境旁邊的
表徵圖,檢查您建立的個人開發環境執行個體的狀態並進入個人開發環境。執行個體狀態為運行中:單擊个人开发环境中正在啟動並執行個人開發環境執行個體,進入個人開發環境。
執行個體狀態為其它狀態:單擊彈窗中的管理环境,在个人开发环境实例頁面找到您建立的執行個體,單擊操作欄中的啟動按鈕,等待實例狀態變為運行中,再單擊該執行個體進入個人開發環境。
說明當个人开发环境地區出現類似
表徵圖時,表示您已成功進入個人開發環境。
步驟二:安裝 Cline
進入個人開發環境後,您可以按照以下步驟配置 DataWorks Agent。本文將以 Cline 為例進行說明。
在建立個人開發環境執行個體時,如果您選擇的鏡像是 dataworks-mcp:py3.11-ubuntu22.04,則無需升級程式引擎和安裝Cline擴充程式。
升級程式引擎
安裝Cline擴充程式
步驟三:配置 LLM 的 API Key
安裝完 Cline 擴充程式後,請按照以下步驟配置 API Key 資訊。這裡將以使用 OpenAI Compatible 模式串連百鍊 API 為例進行配置說明。
其它模式串連模型,請根據介面實際參數進行相關配置。
目前僅支援Use your own API key配置方式,不支援Get Started for Free配置方式。
在 Data Studio 個人開發環境頁面,單擊頂部導覽列右上方的
,進入 Copilot Chat,單擊
切換至 Cline。單擊 Cline 頁面中的Use your own API key,根據下表參數說明進行相關配置。
參數
說明
API Provider
指定您要使用的 API 服務提供者,選擇
OpenAI Compatible。這表示您將使用與 OpenAI API 相容的介面來串連百鍊 API。Base URL
API 服務的基礎 URL,用於指定 API 請求的根地址。
例如百鍊 API 提供的與 OpenAI 相容的 API 端點地址:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1。API Key
用於身分識別驗證的密鑰,可從阿里雲百鍊控制台擷取該 API Key。
Model ID
指定您要使用的具體模型。不同模型在功能定位和效能表現上各有側重。
選擇
qwen-coder-plus或qwen-plus:qwen-coder-plus:適用於代碼產生和編程任務。qwen-plus:適用於通用文本產生和處理任務。
單擊下方的 Let's go! 按鈕,完成 API Key 的配置。
步驟四:配置 MCP Server
完成 API Key 配置後,您可按以下步驟接入並配置 DataWorks MCP Server。更多關於 DataWorks MCP Server的說明,可見附錄:DataWorks MCP Server。
在 Cline 頁面右上方單擊
表徵圖,進入 MCP Serves 的 Marketplace 頁簽。切換至 Installed 頁簽,查看已安裝的 MCP Server;
單擊 Configure MCP Servers 開啟
cline_mcp_settings.json設定檔。DataWorks 預設預置alibabacloud-dataworks-mcp-server的基礎配置,具體配置資訊如下:{ "mcpServers": { "alibabacloud-dataworks-mcp-server": { "command": "npx", "args": [ "alibabacloud-dataworks-mcp-server" ], "env": { "REGION": "cn-shanghai", "ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0", "TOOL_CATEGORIES": "SERVER_IDE_DEFAULT" }, "disabled": false, "autoApprove": [], "timeout": 60 } } }參數
說明
command
npx,表示dataworks-mcp-server提供的指令方式。
args
alibabacloud-dataworks-mcp-server,表示dataworks-mcp-server的指令參數。
env
REGION
樣本中為cn-shanghai,表示當前 DataWorks 工作空間所在的地區。
ALIBABA_CLOUD_CREDENTIALS_URI
指定阿里雲憑證的URI。
重要該參數僅在DataWorks個人開發環境生效,用於擷取阿里雲使用者身份認證。
TOOL_CATEGORIES
配置
Tool分類的白名單。請在此處填寫OpenAPI的分類,多個分類之間用半形逗號分隔。例如:
"TOOL_CATEGORIES":"資料來源,空間管理,資源群組管理,資料地圖,Data Integration,資料開發(新版),營運中心,資料服務,開放平台,資料品質,標籤管理,資訊安全中心,SERVER_IDE_DEFAULT"。說明SERVER_IDE_DEFAULT為個人開發環境上的預設Tools,上述其他業務分類可在巨量資料開發治理平台 DataWorks - OpenAPI 概覽頁的左側分類樹中查看。為提升模型載入效能和使用者體驗,預設配置中將
TOOL_CATEGORIES設為SERVER_IDE_DEFAULT;如需啟用全部 OpenAPI 工具,可刪除該配置項。
TOOL_NAMES
配置
Tool名字的白名單。請在此處填寫OpenAPI的名字,多個名字之間用半形逗號分隔。例如:
"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"。說明TOOL_NAMES可在巨量資料開發治理平台 DataWorks - OpenAPI 概覽中查看。配置資訊儲存後,當頁面成功載入並顯示可用的 Tools 列表時,即表示
alibabacloud-dataworks-mcp-server已安裝並配置成功,您可立即開始使用 DataWorks MCP Server 功能。說明如果未能載入出以下資訊,請確認是否已升級程式引擎。

您可以通過直接編輯上述
cline_mcp_settings.json設定檔,或在 Marketplace 中安裝其他 MCP Server,靈活擴充 DataWorks Agent 的能力。例如,若需在 DataWorks Agent 中使用 Hologres 相關功能,可接入 Hologres MCP Server。
常見問題
Q:在 MCP Server 上執行預設提問時,API 請求長時間無響應,可能是什麼原因?如何解決?
A:若 API 請求長時間處於運行狀態而未返回結果,可能是由於當前使用的程式引擎版本較低,與系統存在相容性問題。建議您升級程式引擎。
Q:當模型響應速度較慢時,有哪些最佳化建議?
A:為提升響應效能,可採取以下措施:
減少同時啟用的 MCP Server 數量,降低系統資源開銷;
在 MCP Server 的設定檔中,通過
env參數顯式指定TOOL_CATEGORIES或TOOL_NAMES,僅載入必要的工具集,從而減少引入的Tools數量。
附錄:DataWorks MCP Server
MCP(Model Context Protocol)是一種為大型語言模型(LLM)提供標準化內容相關的協議。它定義了一種標準方式,使得大模型能夠串連不同的資料來源和工具,從而更有效地理解和處理資訊。MCP用戶端通過MCP協議,可調用各種 MCP Server 的能力。
DataWorks MCP Server 作為一種 MCP Server,封裝DataWorks OpenAPI,擁有 DataWorks 巨量資料處理能力。您可在第三方產品、程式、Agent 接入DataWorks MCP Server,實現對 DataWorks 能力的快速調用。
當您不在 DataWorks 個人開發環境使用時,需要在參數env中配置ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET(請在此處擷取),同時刪除配置ALIBABA_CLOUD_CREDENTIALS_URI。
表徵圖,根據個人喜好進行配置鍵綁定、將外掛程式程式