すべてのプロダクト
Search
ドキュメントセンター

DataWorks:DataWorks とは

最終更新日:Oct 28, 2025

DataWorks は、MaxCompute、E-MapReduce、Hologres、Realtime Compute for Apache Flink、AnalyticDB、StarRocks、PAI などのビッグデータおよび AI サービスと統合された包括的なデータプラットフォームです。データウェアハウス、データレイク、レイクハウスなどの最新のデータアーキテクチャに対して、エンドツーエンドのデータ統合、開発、ガバナンス、分析機能を提供します。2009 年以来 Alibaba Group が実証してきたビッグデータの方法論に基づいて構築された DataWorks は、企業がデータライフサイクル全体を管理するのに役立ち、金融、小売、製造業の何千もの顧客がデジタルトランスフォーメーションを推進するために使用しています。

機能

image

DataWorks は、データライフサイクル全体にわたるデータワークフローを効率化するための一連の強力な機能を提供します。その機能は、データモデリングや統合からセキュリティや分析まで、すべてをカバーする 6 つのコアモジュールで構成されています。

コアモジュール

主な特徴

データモデリング

標準化され、再利用可能なデータウェアハウス資産を体系的に設計および管理します。

Data Integration

クラウドまたはオンプレミス環境の多様なソース間で、リアルタイムおよびオフラインのデータ同期を可能にします。

Data Studio

SQL、Spark、Python をサポートするオンライン IDE で、バッチ、ストリーム、機械学習タスクを開発します。複雑なタスクの依存関係とスケジュールを構成します。

データ資産ガバナンス

Data Quality、データマップ、データ資産管理などの機能を使用してデータ資産を管理し、品質ルールを定義し、データリネージを追跡し、データカタログを管理します。

データセキュリティ

データマスキング、詳細なアクセスコントロール、セキュリティ監査などの機能により、データライフサイクル全体を通じてデータのコンプライアンスとセキュリティを確保します。

データ分析サービス

SQL クエリやスマートデータディスカバリーなどのツールを使用して、インタラクティブな分析を実行し、ビジネスインサイトを得ます。シームレスなアプリケーション統合のために、コードなしでパフォーマンス専有型データ API を生成します。

利点

包括的な機能と卓越したパフォーマンス

プラットフォームの統一された機能は、統合や開発からガバナンスやサービスまで、データライフサイクル全体をカバーします。パフォーマンス専有型向けに設計されており、毎日ペタバイト規模のデータを処理し、数百万の複雑なタスクをスケジューリングして、要求の厳しい大規模なエンタープライズワークロードを処理します。

インテリジェントで使いやすい

完全なグラフィカルユーザーインターフェイスと柔軟な Web ベースの IDE により、学習曲線が短縮されます。SQL と Python のサポートに加えて、コード生成とスマート Q&A のための組み込みのインテリジェントな Copilot により、新規ユーザーも経験豊富なユーザーも迅速に生産性を高めることができます。

費用対効果が高く、すぐに使用可能

そのクラウドネイティブでフルマネージドのアーキテクチャは、データ開発とガバナンスの機能をすぐに利用できるように提供します。このモデルは、自社構築プラットフォームに関連する研究開発 (R&D) および運用保守 (O&M) コストを大幅に削減し、リソースをビジネスイノベーションに集中させることができます。

安全、安定、高信頼性

厳格なテナント分離と詳細なアクセスコントロールシステムにより、金融グレードのセキュリティが保証されます。プラットフォームの安定性はエンタープライズ規模で実証されており、Alibaba Group のグローバルショッピングフェスティバルなどのイベント中のピーク負荷を処理します。

対象ユーザーと代表的な顧客

  • 技術担当者: コアとなるデータ開発とモデリング作業を行うデータエンジニアとアルゴリズムエンジニア。

  • ビジネス担当者: セルフサービスのデータクエリと分析を行う運用スペシャリストと BI アナリスト。

  • 管理担当者: データガバナンスとコンプライアンスコントロールを担当するデータ資産管理者とデータセキュリティ担当者。

DataWorks は、公共サービス、金融、小売、インターネット、自動車、製造など、さまざまな業界の顧客にサービスを提供しています。代表的な顧客は次のとおりです。

  • 中国国家電網のビッグデータセンター: DataWorks を使用して、本社と 27 の省/市企業からのペタバイト規模のデータを一元管理しています。そのエンドツーエンドのデータプラットフォームガバナンスと監視システムは、全体的なデジタルトランスフォーメーションを加速します。

  • Fortune 500 企業であるモンデリーズ・チャイナ: DataWorks のインテリジェントなデータモデリングを活用して、エンドツーエンドのデータガバナンスを実現しています。これにより、データプラットフォームのセルフサービス機能が大幅に強化され、分散型のデータ駆動型意思決定とデジタルリテールトランスフォーメーションが可能になりました。

  • 上場企業 iDreamSky: 自社開発のスケジューリングシステムを、オープンソースの EMR エンジンをベースにした DataWorks に置き換えました。これにより、同社の技術スタッフはビジネス運用により集中できるようになり、ゲームにおけるデータ駆動型の意思決定をサポートしています。

詳細については、「顧客事例」をご参照ください。

利用開始

サービスの有効化

重要

DataWorks は、Chrome 69 以降を搭載した PC でのみ使用できます。

ほとんどのエンタープライズユーザーにとって、コアとなるデータ開発とガバナンス機能の大部分をカバーする Professional Edition で DataWorks サービスを有効化することから始めるのが最適です。

購入前に、「課金の概要」、「購入ガイド」、「エディションの選択と課金」をご参照ください。

ラーニングパス

DataWorks ドキュメントのホームページにある ラーニングパス を使用して、その概念、基本操作、および高度な機能をすばやく理解してください。

image

製品サポート

プリセールスおよびアフターセールスに関するお問い合わせは、チケットを送信してください。

付録: DataWorks の進化

Alibaba Group 内での開発履歴

2009 年の設立以来、DataWorks は Alibaba のビジネス運用とともに進化してきました。MaxCompute や Hologres などのビッグデータコンピューティングエンジンの機能を活用することで、複数の技術段階を経て進化し、Alibaba のデータプラットフォームとデータガバナンスイニシアチブの発展をサポートしてきました。現在、DataWorks は Alibaba Group 内で 50,000 人以上のデイリーアクティブユーザーを抱えており、これは平均して従業員の 3 人に 1 人が使用していることを意味します。300 以上のデータアプリケーションをサポートし、Alibaba Group 全体で 100 以上の業務部門にサービスを提供しています

フェーズ (年)

テーマ

ビジネスの発展

プラットフォームの発展

フェーズ 1 (2012)

多様なビジネスの成長とデータ価値の発見

1688、AliExpress、Taobao、eTao など、複数のビジネスチームが並行して発展しました。

デジタルトランスフォーメーションをサポートするために、さまざまなデータプラットフォームが共存していました:

  • 中国最大の Oracle クラスター。

  • Yunti 1 (Hadoop) は 4,000 台のサーバーに達し、さまざまな BU の複数のクラスターにサービスを提供しました。

  • Tianwang (DataWorks の前身)、Taobao の Hadoop 用の統一スケジューリングツール。

  • Yunti 2 (ODPS、現在の MaxCompute) の開発が開始されました。Ant Financial のマイクロローンビジネス「Muyangquan」が開始されました。

フェーズ 2 (2015)

垂直的なビジネスサイロの出現

垂直的なビジネスの発展:

  • 2013年: Cainiao が設立され、「All-in-Wireless 戦略」が開始されました。

  • 2014年: Amap (高徳) に投資し、Intime Retail と合弁会社を設立し、Alitrip を設立しました。

  • 2015年: DingTalk と Lingshoutong を開始し、Koubei を設立し、AliHealth の支配権を取得しました。

  • 2015年: データサイロの問題に対処するため、「大きなミドルプラットフォーム、小さなフロントオフィス」という組織的およびビジネス的メカニズムを構築するための「ミドルプラットフォーム戦略」を開始しました。

データプラットフォームを統一するための「月面着陸計画」が開始されました:

  • Yunti 1 (Hadoop) は 5,000 台のサーバーでオープンソースのボトルネックに達しました。

  • Yunti 2 は「5K プロジェクト」で 5,000 台を超えるサーバーへのスケーリング能力を証明しました。

  • DataWorks は「Firebird プロジェクト」を通じてグループの統一データ交換プラットフォームをサポートしました。

  • Alibaba のすべてのデータは Yunti 2 に統合され、統一されたグループデータプラットフォームが作成されました。

フェーズ 3 (2018)

データプラットフォームが持続可能なビジネス成長をサポート

データ駆動型のビジネス開発:

  • 運用スタッフは、ユーザーライフサイクル全体をカバーする詳細な運用戦略を採用しました。

  • パーソナライズされたインテリジェントマーケティングが実現しました。

  • マーチャント向けのデータ分析ツールにより、データの収益化が可能になりました。

  • ビジネス運用はリアルタイム処理へと移行しました。

データプラットフォームの構築と資産化:

  • データプラットフォームは、データミドルプラットフォームの構築を完全にサポートしました。

  • DataWorks は、大規模なデータ開発とガバナンスのためのワンストップ機能を構築しました。

  • MaxCompute は 100,000 台のサーバークラスターをサポートし、100 以上の Alibaba Group の BU と 200,000 人以上の Alibaba 従業員の日常業務にサービスを提供しました。

フェーズ 4 (2021)

ビジネスとともに成長するクラウドデータプラットフォーム

ビジネスとデータの深い統合による完全なクラウドネイティブ:

  • コアとなる 11.11 グローバルショッピングフェスティバルシステムの 100% がクラウドに移行しました。Alibaba Cloud はトラフィックのピーク (毎秒 538,000 トランザクション) を処理しました。

  • データプラットフォームは Alibaba Group のすべての BU をサポートし、運用スタッフが問題を迅速に特定・分析し、リアルタイムで意思決定できるようにしました。

  • ショートビデオやライブストリーミングなどの新しいサービスの出現をサポートしました。

データプラットフォームがビジネスに貢献し、ポジティブなフィードバックループを形成:

  • DataWorks が構築したデータプラットフォームはビジネスに完全に貢献し、Alibaba Group 内の 300 以上のデータアプリケーションをサポートしました。

  • MaxCompute のインテリジェントなデータウェアハウスにより、巨大なワークロードを簡単に処理できます。

  • MaxCompute のレイクハウスアーキテクチャは、徐々に次世代のデータプラットフォームアーキテクチャになりました。

  • プラットフォームはエンドツーエンドのデータガバナンスを実装し、わずか 10% のコスト増で 60% のビジネス成長をサポートしました。

Alibaba Cloud での開発履歴

DataWorks は 2015 年に Alibaba Cloud で正式に開始され、長年のビッグデータの専門知識をクラウドの顧客に提供しました。機能の継続的な反復を通じて、DataWorks はさまざまな業界の顧客やパートナーと協力しています。エンドツーエンドのデータガバナンスを提供することで、顧客がデータを効果的に管理および使用できるようにし、データ品質と効率の向上を支援します。

マイルストーン

説明

2009

Alibaba Group で DataWorks プロジェクトが開始

社内の DataX データ同期エンジンとタスクスケジューリングエンジンを開発し、超大規模な Hadoop クラスターにサービスを提供しました。

2013

「月面着陸計画」が開始され、技術スタックが変革

コードネーム: 月面着陸計画。グループはプラットフォーム統一計画を開始し、Hadoop から MaxCompute へ完全に移行しました。DataWorks は MaxCompute に完全に対応するように適合されました。

2015

DataWorks がクラウドで正式に開始

コードネーム: Shujia Platform。「Shujia Platform」のコアプロダクトとして、DataWorks はパブリッククラウド市場に参入し、企業や政府の顧客へのサービス提供を開始しました。

2017

国際展開

世界中の 12 以上の Alibaba Cloud リージョンでデプロイメントを完了し、グローバルな顧客へのサービス提供を開始しました。

2018

DataWorks V2.0 がリリース

データ統合、データ開発、データサービス、アプリケーション開発をカバーする、ワンストップのインテリジェントなビッグデータクラウド R&D プラットフォームに進化しました。

2019

DataWorks V3.0 がリリース

複数のコンピューティングエンジンからのタスクのハイブリッドオーケストレーションをサポートし、新しい包括的なデータガバナンスシステムを導入しました。

2020

完全なオープン化とエコシステムの構築

パートナーエコシステムを構築するための新しいオープンプラットフォームを開始しました。Forrester Wave™ for Cloud Data Warehouses で Strong Performer として認められました。

2022

データガバナンス機能のアップグレード

「データモデリングおよびガバナンスセンター」製品を開始しました。中国のデータガバナンス市場で市場シェア第 1 位を達成しました (IDC)。

2024

AIGC を採用し、新しい Data+AI 機能をリリース

コアリリース: Copilot。データ開発および分析機能をアップグレードし、Copilot 製品をリリースし、OpenLake レイクハウスアーキテクチャに基づいたエンドツーエンドの Data+AI 開発およびガバナンスを提供しました。

詳細情報