全部產品
Search
文件中心

DataWorks:基於三方用戶端的DataWorks Agent

更新時間:Feb 14, 2026

DataWorks Agent基於MCP協議(模型上下文協議),可對接DataWorks MCP Server及其他巨量資料MCP Server(如Hologres MCP Server),旨在通過自然語言互動在DataWorks中實現資料開發、任務營運和Data Integration等能力。

重要

該功能基於三方用戶端實現,若您希望體驗更便捷的Agent智能體服務,可參見DataWorks Agent

功能介紹

DataWorks Agent支援通過自然語言互動方式,在智能交談視窗實現巨量資料開發。它的主要原理如下:DataWorks Agent通過大語言模型(LLM)解析需求,並智能調用MCP Server能力完成任務執行。

例如,您可通過DataWorks Agent交談視窗輸入“我有幾個工作空間”,Agent會通過LLM解析並調用內建DataWorks OpenAPIDataWorks MCP Server提供的ListProjects工具查詢,並返回結果。當任務較複雜時,LLM將與MCP Server進行多次互動。

DataWorks Agent不僅整合DataWorks MCP Server,還支援接入其他MCP Server。您也可按需選擇自己的LLM(比如通義千問、DeepSeek、OpenAI等)。

image

您也可輸入如下提問,體驗更多DataWorks Agent支援的任務情境。

適用範圍

樣本提問

資料開發

【查詢任務】查詢本工作空間專案目錄下所有調度類型為暫停MaxCompute SQL資料開發節點。

【重新命名任務】幫我把上述節點的名字修改為:無效節點_待刪除,多個節點可以用序號來區分。

【建立任務】幫我在本工作空間專案目錄下建立5個MaxCompute SQL節點,名稱以MC_Demo開頭,中間底線串連,末尾以01開始的數字自增結束。

任務營運

【重跑失敗任務】查看本工作空間,20250330日運行失敗的任務,並重跑這些執行個體。注意bizdate是毫秒層級的時間戳記。

【查詢失敗執行個體】查看本工作空間專案下,20250331日狀態為失敗的執行個體,bizdate的格式為毫秒級的時間戳記。

【分析任務重跑屬性】分析這些任務的重跑屬性,是否可重跑,如可重跑,則重跑任務。

Data Integration

【同步MySQL單表至MaxCompute】請在當前工作空間中建立一個離線Data Integration任務:

  • 來源資料源mc_test_mysql(表名:users);

  • 目標資料來源mc_test_maxcompute(目標表名:users,與源表同名);

  • 資源群組mc_test_res

  • 欄位對應方式:自動同名映射(即源表與目標表中欄位名相同的列將被一一對應)。

資料分析

【銷量分析】幫我分析order表這個月前10銷量商品的銷量走向。

使用限制

僅支援在已啟用新版資料開發的工作空間中,於個人開發環境中使用。

重要

個人開發環境重啟後,需要重新安裝MCP Server功能,請謹慎操作。

計費說明

使用 DataWorks Agent 將產生以下費用:

  • DataWorks OpenAPI 呼叫費用

    當 Agent 通過 MCP Server 調用 DataWorks OpenAPI 時,將按照OpenAPI計費標準收取相應費用。

  • LLM Token 費用

    Agent 在解析使用者意圖、產生自然語言回複等過程中,需調用您配置的大模型(如通義千問等)。該過程將消耗模型輸入與輸出的 Token 數量,並依據所選模型服務商的計費規則進行計費。如使用百鍊中的qwen-coder-plus模型時,費用將依據百鍊計費說明計算。

快速體驗DataWorks Agent

當您完成DataWorks Agent配置後,單擊 Cline 頁面右上方的image表徵圖,進入 DataWorks Agent 對話介面快速體驗:查詢當前工作空間的成員。

您只需輸入提問:查詢當前工作空間的成員。

Agent拆解步驟並運行:

  1. 需求解析與確認:Agent 解析使用者意圖(如“查詢當前工作空間成員”),自動識別需調用的 ListProjectMembers 介面,並彈窗提示使用者確認目標工作空間(ProjectId)等必要參數。

  2. 介面調用與響應:經使用者授權後,Agent 調用 ListProjectMembers OpenAPI,擷取並結構化返回該工作空間的成員列表(含角色、帳號類型等資訊)。更多關於ListProjectMembersOpenAPI的說明,可以參見:ListProjectMembers - 查詢工作空間成員列表

    說明
    • 運行過程中,系統將提示您確認相關操作並擷取必要資訊。您可以單擊 Approve 同意執行,或單擊 Reject 拒絕該操作。

    • 關鍵步驟的拆解邏輯可能因任務複雜度、LLM 選型及模型版本差異而略有不同,實際執行流程以當前會話中 Agent 的解析與互動為準。

配置DataWorks Agent

DataWorks Agent 通過 MCP 用戶端外掛程式(例如 Cline)構建前端對話介面,並通過 MCP Server 配置接入 DataWorks MCP Server阿里雲MCP Server

說明

您可按需接入更多開源MCP Server,以增強 DataWorks Agent 的能力。

準備工作

步驟一:進入個人開發環境

您可通過以下步驟,啟用並進入個人開發環境。

  1. 進入DataWorks工作空間列表頁,在頂部切換至目標地區,找到目標工作空間,單擊操作列的快速進入 > Data Studio,進入Data Studio。

  2. 單擊頂部導覽列个人开发环境旁邊的image表徵圖,檢查您建立的個人開發環境執行個體的狀態並進入個人開發環境。

    • 執行個體狀態為運行中:單擊个人开发环境中正在啟動並執行個人開發環境執行個體,進入個人開發環境。

    • 執行個體狀態為其它狀態:單擊彈窗中的管理环境,在个人开发环境实例頁面找到您建立的執行個體,單擊操作欄中的啟動按鈕,等待實例狀態變為運行中,再單擊該執行個體進入個人開發環境。

    說明

    个人开发环境地區出現類似image表徵圖時,表示您已成功進入個人開發環境。

步驟二:安裝 Cline

進入個人開發環境後,您可以按照以下步驟配置 DataWorks Agent。本文將以 Cline 為例進行說明。

重要

在建立個人開發環境執行個體時,如果您選擇的鏡像是 dataworks-mcp:py3.11-ubuntu22.04,則無需升級程式引擎安裝Cline擴充程式

升級程式引擎

如果您使用的是之前的個人開發環境,或者已經在個人開發環境中安裝過 Cline 擴充程式,您需要按照以下方法來升級現有的底層引擎,以便使用擴充程式功能。已進行升級操作可跳過該步驟。

一鍵升級:進入個人開發環境後,如果遇到提示底層引擎升級適配的彈窗,請單擊一鍵升級按鈕來完成底層引擎的適配升級。

命令升級:單擊頁面底部工具列左側的image表徵圖,進入終端命令欄,在命令欄中輸入以下升級命令,單擊斷行符號進行升級。

wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/node

bash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh)  0.2.169
說明

上述命令中的 ${REGION} 無需您手動替換,系統將自動識別並填充當前地區資訊;您也可在終端中執行 echo ${REGION} 命令,確認實際解析的地區值。

升級完成後,請在彈窗中單擊重新載入視窗以應用最新的更改。

安裝Cline擴充程式

您可根據以下步驟,在個人開發環境安裝擴充程式Cline,作為您的Agent交談視窗。

  1. 單擊個人開發環境頁面左側導覽列的image表徵圖,進入程式擴充頁。

  2. 在程式擴充頁的搜尋方塊中輸入Cline

  3. 找到下方出現的擴充程式 Cline。

  4. 單擊 Cline 程式右下方的安裝,等待程式安裝完成。

  5. 安裝完成後,在 Data Studio 頁面,單擊頂部導覽列右上方的image,進入 Copilot Chat,單擊image切換至 Cline。

  6. 進一步您可以通過按右鍵image表徵圖,根據個人喜好進行配置鍵綁定、將外掛程式程式移動到 > 主側邊欄移動到 > 面板等。

image

步驟三:配置 LLM 的 API Key

安裝完 Cline 擴充程式後,請按照以下步驟配置 API Key 資訊。這裡將以使用 OpenAI Compatible 模式串連百鍊 API 為例進行配置說明。

說明
  • 其它模式串連模型,請根據介面實際參數進行相關配置。

  • 目前僅支援Use your own API key配置方式,不支援Get Started for Free配置方式。

  1. 在 Data Studio 個人開發環境頁面,單擊頂部導覽列右上方的image,進入 Copilot Chat,單擊image切換至 Cline。

  2. 單擊 Cline 頁面中的Use your own API key,根據下表參數說明進行相關配置。

    參數

    說明

    API Provider

    指定您要使用的 API 服務提供者,選擇OpenAI Compatible。這表示您將使用與 OpenAI API 相容的介面來串連百鍊 API。

    Base URL

    API 服務的基礎 URL,用於指定 API 請求的根地址。

    例如百鍊 API 提供的與 OpenAI 相容的 API 端點地址:https://dashscope-intl.aliyuncs.com/compatible-mode/v1

    API Key

    用於身分識別驗證的密鑰,可從阿里雲百鍊控制台擷取該 API Key。

    Model ID

    指定您要使用的具體模型。不同模型在功能定位和效能表現上各有側重。

    選擇qwen-coder-plusqwen-plus

    • qwen-coder-plus:適用於代碼產生和編程任務。

    • qwen-plus:適用於通用文本產生和處理任務。

  3. 單擊下方的 Let's go! 按鈕,完成 API Key 的配置。

步驟四:配置 MCP Server

完成 API Key 配置後,您可按以下步驟接入並配置 DataWorks MCP Server。更多關於 DataWorks MCP Server的說明,可見附錄:DataWorks MCP Server

  1. 在 Cline 頁面右上方單擊image表徵圖,進入 MCP Serves Marketplace 頁簽。

  2. 切換至 Installed 頁簽,查看已安裝的 MCP Server;

  3. 單擊 Configure MCP Servers 開啟cline_mcp_settings.json設定檔。DataWorks 預設預置 alibabacloud-dataworks-mcp-server 的基礎配置,具體配置資訊如下:

    {
      "mcpServers": {
        "alibabacloud-dataworks-mcp-server": {
          "command": "npx",
          "args": [
            "alibabacloud-dataworks-mcp-server"
          ],
          "env": {
            "REGION": "cn-shanghai",
            "ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0",
            "TOOL_CATEGORIES": "SERVER_IDE_DEFAULT"
          },
          "disabled": false,
          "autoApprove": [],
          "timeout": 60
        }
      }
    }

    參數

    說明

    command

    npx,表示dataworks-mcp-server提供的指令方式。

    args

    alibabacloud-dataworks-mcp-server,表示dataworks-mcp-server的指令參數。

    env

    REGION

    樣本中為cn-shanghai,表示當前 DataWorks 工作空間所在的地區。

    ALIBABA_CLOUD_CREDENTIALS_URI

    指定阿里雲憑證的URI。

    重要

    該參數僅在DataWorks個人開發環境生效,用於擷取阿里雲使用者身份認證。

    TOOL_CATEGORIES

    配置Tool分類的白名單。請在此處填寫OpenAPI的分類,多個分類之間用半形逗號分隔。

    例如:"TOOL_CATEGORIES":"資料來源,空間管理,資源群組管理,資料地圖,Data Integration,資料開發(新版),營運中心,資料服務,開放平台,資料品質,標籤管理,資訊安全中心,SERVER_IDE_DEFAULT"

    說明
    • SERVER_IDE_DEFAULT為個人開發環境上的預設Tools,上述其他業務分類可在巨量資料開發治理平台 DataWorks - OpenAPI 概覽頁的左側分類樹中查看。

    • 為提升模型載入效能和使用者體驗,預設配置中將 TOOL_CATEGORIES 設為 SERVER_IDE_DEFAULT;如需啟用全部 OpenAPI 工具,可刪除該配置項。

    TOOL_NAMES

    配置Tool名字的白名單。請在此處填寫OpenAPI的名字,多個名字之間用半形逗號分隔。

    例如:"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"

  4. 配置資訊儲存後,當頁面成功載入並顯示可用的 Tools 列表時,即表示 alibabacloud-dataworks-mcp-server 已安裝並配置成功,您可立即開始使用 DataWorks MCP Server 功能。

    說明

    如果未能載入出以下資訊,請確認是否已升級程式引擎

    image

  5. 您可以通過直接編輯上述 cline_mcp_settings.json 設定檔,或在 Marketplace 中安裝其他 MCP Server,靈活擴充 DataWorks Agent 的能力。例如,若需在 DataWorks Agent 中使用 Hologres 相關功能,可接入 Hologres MCP Server

常見問題

  • Q:在 MCP Server 上執行預設提問時,API 請求長時間無響應,可能是什麼原因?如何解決?

    A:若 API 請求長時間處於運行狀態而未返回結果,可能是由於當前使用的程式引擎版本較低,與系統存在相容性問題。建議您升級程式引擎

  • Q:當模型響應速度較慢時,有哪些最佳化建議?

    A:為提升響應效能,可採取以下措施:

    • 減少同時啟用的 MCP Server 數量,降低系統資源開銷;

    • 在 MCP Server 的設定檔中,通過 env 參數顯式指定 TOOL_CATEGORIES 或 TOOL_NAMES,僅載入必要的工具集,從而減少引入的Tools數量。

附錄:DataWorks MCP Server

MCP(Model Context Protocol)是一種為大型語言模型(LLM)提供標準化內容相關的協議。它定義了一種標準方式,使得大模型能夠串連不同的資料來源和工具,從而更有效地理解和處理資訊。MCP用戶端通過MCP協議,可調用各種 MCP Server 的能力。

DataWorks MCP Server 作為一種 MCP Server,封裝DataWorks OpenAPI,擁有 DataWorks 巨量資料處理能力。您可在第三方產品、程式、Agent 接入DataWorks MCP Server,實現對 DataWorks 能力的快速調用。

重要

當您不在 DataWorks 個人開發環境使用時,需要在參數env中配置ALIBABA_CLOUD_ACCESS_KEY_IDALIBABA_CLOUD_ACCESS_KEY_SECRET(請在此處擷取),同時刪除配置ALIBABA_CLOUD_CREDENTIALS_URI

image