全部產品
Search
文件中心

DataWorks:什麼是DataWorks

更新時間:Oct 22, 2025

DataWorks是一站式智能巨量資料開發治理平台,適配阿里雲MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等數十種巨量資料和AI計算服務,為資料倉儲、資料湖、湖倉一體、Data+AI解決方案提供全鏈路智能化的Data Integration、巨量資料AI一體化開發、資料分析與主動式資料資產治理服務,協助企業進行全生命週期資料管理。自2009年以來,DataWorks以阿里巴巴集團巨量資料建設方法論為基礎,不斷沉澱資料治理最佳實務,現已廣泛應用於包括政務、金融、零售、互連網、汽車、製造等眾多行業,數以萬計的客戶信賴並選擇DataWorks進行數字化升級和價值創造。

產品能力

DataWorks十多年沉澱數百項核心能力,通過智能資料建模全域Data Integration高效資料生產主動資料治理全面資料安全、資料分析服務六大全鏈路資料治理的能力,協助企業治理內部不斷上漲的“資料懸河”,釋放企業的資料生產力。

核心模組

主要能力

智能資料建模

協助企業系統化地規劃、設計和管理資料倉儲,確保資料資產的規範、可複用與高品質。

全域Data Integration

支援複雜網路環境(雲上、本地IDC)和豐富資料來源之間的資料轉送,實現即時、離線、全增量的全情境資料同步。

高效資料生產

提供線上的批處理、流處理和機器學習任務開發環境,支援SQL、Spark、Python等多種語言,並具備強大的任務調度與依賴配置能力。

主動資料治理

包含資料品質、資料地圖、資料資產管理等功能,協助您定義品質規則、探查資料血緣、盤點和管理資料資產。

全面資料安全

提供資料脫敏、許可權管控、安全審計等能力,保障資料在整個生命週期中的合規與安全。

資料分析服務

提供SQL查詢、智能資料洞察等工具支援互動式分析與業務洞察,也支援將資料零代碼產生為高效能API,實現與業務應用的無縫整合。

產品優勢

功能健全,效能卓越

作為一站式全域資料平台,DataWorks 的能力覆蓋了從Data Integration、開發、治理到服務的全生命週期。DataWorks 具備處理海量資料的卓越效能,能夠支撐每日PB層級的資料同步和千萬層級的複雜任務調度,滿足最嚴苛的企業級資料處理需求。

智能易用,輕鬆上手

DataWorks 提供全圖形化的操作介面和開放靈活的Web IDE,支援SQL、Python等多種主流開發語言。同時內建強大的 Copilot 智能助手,能夠輔助代碼產生、智能問答和資料尋找,讓新手也能在1小時內快速上手。這一易用性已在阿里巴巴數千名營運人員的日常工作中得到驗證。

降本增效,開箱即用

DataWorks 採用雲原生、全託管的架構,為您提供開箱即用的資料開發與治理能力。相比於自研平台或自行搭建開源工具,DataWorks 能幫您有效降低平台研發和營運的巨大成本,將寶貴的研發資源從繁重的底層維護中解放出來,讓您能夠更專註於業務創新本身。

安全穩定,值得信賴

DataWorks 提供金融層級的資料安全保障,通過嚴格的租戶隔離和細粒度的許可權控制體系,確保您的資料資產安全合規。同時,我們的平枱曆經阿里巴巴“雙11”等流量洪峰的嚴苛考驗,其穩定性與可靠性已得到充分證明,值得您的信賴。

受眾和典型客戶

  • 技術人員:如資料工程師、演算法工程師,進行核心的資料開發和建模工作。

  • 業務人員:如營運、BI分析師,進行自助式的資料查詢和分析。

  • 管理員:如資料資產管理員、資料安全負責人,進行資料治理與合規管控。

DataWorks客戶覆蓋政務、金融、零售、互連網、汽車、製造等各行業各領域,典型客戶如下:

  • 國家電網巨量資料中心:通過DataWorks實現總部+27家省(市)公司PB級資料的統一管理,通過全鏈路資料中台的治理與監測營運體系,加快電網整體數字化轉型升級。

  • 世界500強億滋中國:通過DataWorks智能資料建模進行全鏈路的資料模型治理,極大提升資料中台的自服務能⼒,讓企業資料決策實現下放,釋放新零售的數字化力量。

  • 上市公司創夢天地:基於開源的EMR引擎,用DataWorks替換自研調度系統,企業內部的技術人員可以更加專註業務,助力遊戲行業的資料化營運。

更多客戶案例請參見客戶案例章節。

開始 DataWorks 之旅

產品開通

重要

當前DataWorks僅支援在PC端Chrome瀏覽器69以上版本使用。

對於大多數企業級使用者,我們推薦從專業版開始開通DataWorks服務,它覆蓋了絕大部分資料開發與治理的核心功能。

購買前建議閱讀計費簡介購買指引軟體版本選擇與計費

學習路徑

您可以通過DataWorks文檔首頁的學習路徑,快速瞭解DataWorks的相關概念、基礎操作及進階操作等內容。

image

產品支援

您可以提交工單進行售前售後諮詢。

附錄:DataWorks 發展之路

阿里巴巴集團內發展曆程

從2009年產品立項開始,DataWorks與阿里巴巴業務共同發展,結合MaxCompute、Hologres等巨量資料計算引擎的能力,跨越多個技術階段,支撐阿里巴巴資料中台與資料治理建設。目前阿里巴巴集團內DataWorks每天活躍使用者數超過5萬人,平均每3個人就有1個人使用DataWorks,支援300多個資料應用,服務100多個阿里巴巴集團事業部

發展階段 (年份)

階段主題

業務發展

平台發展

第一階段 (2012)

業務百花齊放,探索資料價值

多個業務團隊並行發展,如1688、AliExpress、淘寶、一淘等。

各種資料平台並存,支援數字化轉型:

  • Oracle之巔,亞洲最大叢集。

  • 雲梯1 (Hadoop) 達到4000台,服務多個BU的多個叢集。

  • 大淘寶Hadoop統一調度工具 - 天網 (DataWorks前身)。

  • 雲梯2 (ODPS, 現MaxCompute) 啟動研發,螞蟻小微貸款“牧羊犬”業務上線。

第二階段 (2015)

業務垂直小閉環,資料孤島顯現

業務垂直發展:

  • 2013年:創立菜鳥,啟動“all-in無線”戰略。

  • 2014年:投資高德,與銀泰合資,成立阿里旅行。

  • 2015年:推出DingTalk/零售通,成立口碑,控股阿里健康。

  • 2015年啟動“中台戰略”:構建“大中台,小前台”的組織和業務機制,以應對資料孤島問題。

啟動登月計劃,統一資料平台:

  • 雲梯1 (Hadoop) 遇到5000台的開源瓶頸。

  • 雲梯2通過5K專案證明其跨入5000台的能力。

  • DataWorks通過“火鳥專案”支撐集團統一資料交換平台。

  • 將阿里所有的資料整合到雲梯2,打造集團統一資料平台。

第三階段 (2018)

資料中台支撐業務可持續發展

資料驅動業務發展:

  • 小二(營運人員)覆蓋使用者生命週期的精細化營運策略。

  • 實現個人化的智能營銷。

  • “生意參謀”探索資料業務化。

  • 業務走向即時化。

資料中台建設 + 資產化:

  • 資料平台全面支撐資料中台建設。

  • DataWorks 構建了大規模資料開發與治理的一站式能力。

  • MaxCompute 支援10萬台叢集,服務100+集團BU、20萬+阿里員工的日常營運。

第四階段 (2021)

雲上資料中台與業務伴生

全面雲原生化,業務與資料深度融合:

  • 雙11核心系統100%上雲,阿里雲抗住流量洪峰(每秒53.8萬筆)。

  • 資料中台覆蓋集團所有BU,營運小二可及時發現並分析問題,實現即時決策。

  • 支撐短視頻、直播等新業務的出現。

資料中台服務業務,形成“正迴圈”:

  • DataWorks建設的資料中台全面服務業務,支援集團內300+資料應用。

  • MaxCompute 智能數倉讓“雙11”成為日常。

  • MaxCompute 湖倉一體逐步成為下一代資料平台架構。

  • 平台進行全鏈路資料治理,實現以10%的成本增長支撐60%的業務增速。

阿里雲上發展曆程

2015年DataWorks正式上雲,將多年沉澱的巨量資料建設方法論產品化輸出,服務阿里雲上客戶,通過不斷迭代的產品能力,DataWorks正在與各行各業的客戶與夥伴一起,通過全鏈路資料治理,管得好資料、用得好資料,讓資料從低質低效向高質高效流動。

年份

裡程碑事件

關鍵描述

2009

DataWorks 在阿里集團立項

自研資料同步引擎DataX及任務調度引擎,服務超大規模Hadoop叢集。

2013

啟動“登月計劃”,技術棧轉型

專案代號:登月計劃。集團啟動平台統一計劃,全面從Hadoop轉向MaxCompute,DataWorks全面服務MaxCompute。

2015

DataWorks 正式上雲

專案代號:數加平台。作為“數加平台”核心產品,進入公用雲市場,開始服務企業和政務客戶。

2017

走向國際化

完成阿里雲12+國內外地區部署,開始服務全球客戶。

2018

DataWorks V2.0 發布

形成包含Data Integration-資料開發-資料服務-應用開發的一站式巨量資料智能雲研發平台。

2019

DataWorks V3.0 發布

支援多種計算引擎任務混合編排,構建全新資料綜合治理體系。

2020

全面開放,構建生態

全新推出開放平台,構建夥伴生態;入圍Forrester全球雲數倉廠商評測卓越表現者象限。

2022

資料治理能力全新升級

推出“資料建模與資料治理中心”產品;在中國資料治理相關市場份額獲得第一(IDC)。

2024

擁抱 AIGC,發布 Data+AI 新能力

核心發布:Copilot。全新升級資料開發與分析能力,發布Copilot產品,基於OpenLake資料湖倉架構,提供Data+AI全鏈路開發與治理能力。

更多閱讀