DataWorks是一站式智能巨量資料開發治理平台,適配阿里雲MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等數十種巨量資料和AI計算服務,為資料倉儲、資料湖、湖倉一體、Data+AI解決方案提供全鏈路智能化的Data Integration、巨量資料AI一體化開發、資料分析與主動式資料資產治理服務,協助企業進行全生命週期資料管理。自2009年以來,DataWorks以阿里巴巴集團巨量資料建設方法論為基礎,不斷沉澱資料治理最佳實務,現已廣泛應用於包括政務、金融、零售、互連網、汽車、製造等眾多行業,數以萬計的客戶信賴並選擇DataWorks進行數字化升級和價值創造。
產品能力
DataWorks十多年沉澱數百項核心能力,通過智能資料建模、全域Data Integration、高效資料生產、主動資料治理、全面資料安全、資料分析服務六大全鏈路資料治理的能力,協助企業治理內部不斷上漲的“資料懸河”,釋放企業的資料生產力。
核心模組 | 主要能力 |
智能資料建模 | 協助企業系統化地規劃、設計和管理資料倉儲,確保資料資產的規範、可複用與高品質。 |
全域Data Integration | 支援複雜網路環境(雲上、本地IDC)和豐富資料來源之間的資料轉送,實現即時、離線、全增量的全情境資料同步。 |
高效資料生產 | 提供線上的批處理、流處理和機器學習任務開發環境,支援SQL、Spark、Python等多種語言,並具備強大的任務調度與依賴配置能力。 |
主動資料治理 | 包含資料品質、資料地圖、資料資產管理等功能,協助您定義品質規則、探查資料血緣、盤點和管理資料資產。 |
全面資料安全 | 提供資料脫敏、許可權管控、安全審計等能力,保障資料在整個生命週期中的合規與安全。 |
資料分析服務 | 提供SQL查詢、智能資料洞察等工具支援互動式分析與業務洞察,也支援將資料零代碼產生為高效能API,實現與業務應用的無縫整合。 |
產品優勢
功能健全,效能卓越
作為一站式全域資料平台,DataWorks 的能力覆蓋了從Data Integration、開發、治理到服務的全生命週期。DataWorks 具備處理海量資料的卓越效能,能夠支撐每日PB層級的資料同步和千萬層級的複雜任務調度,滿足最嚴苛的企業級資料處理需求。
智能易用,輕鬆上手
DataWorks 提供全圖形化的操作介面和開放靈活的Web IDE,支援SQL、Python等多種主流開發語言。同時內建強大的 Copilot 智能助手,能夠輔助代碼產生、智能問答和資料尋找,讓新手也能在1小時內快速上手。這一易用性已在阿里巴巴數千名營運人員的日常工作中得到驗證。
降本增效,開箱即用
DataWorks 採用雲原生、全託管的架構,為您提供開箱即用的資料開發與治理能力。相比於自研平台或自行搭建開源工具,DataWorks 能幫您有效降低平台研發和營運的巨大成本,將寶貴的研發資源從繁重的底層維護中解放出來,讓您能夠更專註於業務創新本身。
安全穩定,值得信賴
DataWorks 提供金融層級的資料安全保障,通過嚴格的租戶隔離和細粒度的許可權控制體系,確保您的資料資產安全合規。同時,我們的平枱曆經阿里巴巴“雙11”等流量洪峰的嚴苛考驗,其穩定性與可靠性已得到充分證明,值得您的信賴。
受眾和典型客戶
技術人員:如資料工程師、演算法工程師,進行核心的資料開發和建模工作。
業務人員:如營運、BI分析師,進行自助式的資料查詢和分析。
管理員:如資料資產管理員、資料安全負責人,進行資料治理與合規管控。
DataWorks客戶覆蓋政務、金融、零售、互連網、汽車、製造等各行業各領域,典型客戶如下:
國家電網巨量資料中心:通過DataWorks實現總部+27家省(市)公司PB級資料的統一管理,通過全鏈路資料中台的治理與監測營運體系,加快電網整體數字化轉型升級。
世界500強億滋中國:通過DataWorks智能資料建模進行全鏈路的資料模型治理,極大提升資料中台的自服務能⼒,讓企業資料決策實現下放,釋放新零售的數字化力量。
上市公司創夢天地:基於開源的EMR引擎,用DataWorks替換自研調度系統,企業內部的技術人員可以更加專註業務,助力遊戲行業的資料化營運。
更多客戶案例請參見客戶案例章節。
開始 DataWorks 之旅
產品開通
當前DataWorks僅支援在PC端Chrome瀏覽器69以上版本使用。
對於大多數企業級使用者,我們推薦從專業版開始開通DataWorks服務,它覆蓋了絕大部分資料開發與治理的核心功能。
購買前建議閱讀計費簡介、購買指引、軟體版本選擇與計費。
學習路徑
您可以通過DataWorks文檔首頁的學習路徑,快速瞭解DataWorks的相關概念、基礎操作及進階操作等內容。

產品支援
您可以提交工單進行售前售後諮詢。
附錄:DataWorks 發展之路
阿里巴巴集團內發展曆程
從2009年產品立項開始,DataWorks與阿里巴巴業務共同發展,結合MaxCompute、Hologres等巨量資料計算引擎的能力,跨越多個技術階段,支撐阿里巴巴資料中台與資料治理建設。目前阿里巴巴集團內DataWorks每天活躍使用者數超過5萬人,平均每3個人就有1個人使用DataWorks,支援300多個資料應用,服務100多個阿里巴巴集團事業部。
發展階段 (年份) | 階段主題 | 業務發展 | 平台發展 |
第一階段 (2012) | 業務百花齊放,探索資料價值 | 多個業務團隊並行發展,如1688、AliExpress、淘寶、一淘等。 | 各種資料平台並存,支援數字化轉型:
|
第二階段 (2015) | 業務垂直小閉環,資料孤島顯現 | 業務垂直發展:
| 啟動登月計劃,統一資料平台:
|
第三階段 (2018) | 資料中台支撐業務可持續發展 | 資料驅動業務發展:
| 資料中台建設 + 資產化:
|
第四階段 (2021) | 雲上資料中台與業務伴生 | 全面雲原生化,業務與資料深度融合:
| 資料中台服務業務,形成“正迴圈”:
|
阿里雲上發展曆程
2015年DataWorks正式上雲,將多年沉澱的巨量資料建設方法論產品化輸出,服務阿里雲上客戶,通過不斷迭代的產品能力,DataWorks正在與各行各業的客戶與夥伴一起,通過全鏈路資料治理,管得好資料、用得好資料,讓資料從低質低效向高質高效流動。
年份 | 裡程碑事件 | 關鍵描述 |
2009 | DataWorks 在阿里集團立項 | 自研資料同步引擎DataX及任務調度引擎,服務超大規模Hadoop叢集。 |
2013 | 啟動“登月計劃”,技術棧轉型 | 專案代號:登月計劃。集團啟動平台統一計劃,全面從Hadoop轉向MaxCompute,DataWorks全面服務MaxCompute。 |
2015 | DataWorks 正式上雲 | 專案代號:數加平台。作為“數加平台”核心產品,進入公用雲市場,開始服務企業和政務客戶。 |
2017 | 走向國際化 | 完成阿里雲12+國內外地區部署,開始服務全球客戶。 |
2018 | DataWorks V2.0 發布 | 形成包含Data Integration-資料開發-資料服務-應用開發的一站式巨量資料智能雲研發平台。 |
2019 | DataWorks V3.0 發布 | 支援多種計算引擎任務混合編排,構建全新資料綜合治理體系。 |
2020 | 全面開放,構建生態 | 全新推出開放平台,構建夥伴生態;入圍Forrester全球雲數倉廠商評測卓越表現者象限。 |
2022 | 資料治理能力全新升級 | 推出“資料建模與資料治理中心”產品;在中國資料治理相關市場份額獲得第一(IDC)。 |
2024 | 擁抱 AIGC,發布 Data+AI 新能力 | 核心發布:Copilot。全新升級資料開發與分析能力,發布Copilot產品,基於OpenLake資料湖倉架構,提供Data+AI全鏈路開發與治理能力。 |