DataWorks は、MaxCompute、E-MapReduce、Hologres、Realtime Compute for Apache Flink、AnalyticDB、StarRocks、PAI などのビッグデータおよび AI サービスと統合された包括的なデータプラットフォームです。データウェアハウス、データレイク、レイクハウスなどの最新のデータアーキテクチャに対して、エンドツーエンドのデータ統合、開発、ガバナンス、分析機能を提供します。2009 年以来 Alibaba Group が実証してきたビッグデータの方法論に基づいて構築された DataWorks は、企業がデータライフサイクル全体を管理するのに役立ち、金融、小売、製造業の何千もの顧客がデジタルトランスフォーメーションを推進するために使用しています。
機能
DataWorks は、データライフサイクル全体にわたるデータワークフローを効率化するための一連の強力な機能を提供します。その機能は、データモデリングや統合からセキュリティや分析まで、すべてをカバーする 6 つのコアモジュールで構成されています。
コアモジュール | 主な特徴 |
標準化され、再利用可能なデータウェアハウス資産を体系的に設計および管理します。 | |
クラウドまたはオンプレミス環境の多様なソース間で、リアルタイムおよびオフラインのデータ同期を可能にします。 | |
SQL、Spark、Python をサポートするオンライン IDE で、バッチ、ストリーム、機械学習タスクを開発します。複雑なタスクの依存関係とスケジュールを構成します。 | |
Data Quality、データマップ、データ資産管理などの機能を使用してデータ資産を管理し、品質ルールを定義し、データリネージを追跡し、データカタログを管理します。 | |
データマスキング、詳細なアクセスコントロール、セキュリティ監査などの機能により、データライフサイクル全体を通じてデータのコンプライアンスとセキュリティを確保します。 | |
データ分析サービス | SQL クエリやスマートデータディスカバリーなどのツールを使用して、インタラクティブな分析を実行し、ビジネスインサイトを得ます。シームレスなアプリケーション統合のために、コードなしでパフォーマンス専有型データ API を生成します。 |
利点
包括的な機能と卓越したパフォーマンス
プラットフォームの統一された機能は、統合や開発からガバナンスやサービスまで、データライフサイクル全体をカバーします。パフォーマンス専有型向けに設計されており、毎日ペタバイト規模のデータを処理し、数百万の複雑なタスクをスケジューリングして、要求の厳しい大規模なエンタープライズワークロードを処理します。
インテリジェントで使いやすい
完全なグラフィカルユーザーインターフェイスと柔軟な Web ベースの IDE により、学習曲線が短縮されます。SQL と Python のサポートに加えて、コード生成とスマート Q&A のための組み込みのインテリジェントな Copilot により、新規ユーザーも経験豊富なユーザーも迅速に生産性を高めることができます。
費用対効果が高く、すぐに使用可能
そのクラウドネイティブでフルマネージドのアーキテクチャは、データ開発とガバナンスの機能をすぐに利用できるように提供します。このモデルは、自社構築プラットフォームに関連する研究開発 (R&D) および運用保守 (O&M) コストを大幅に削減し、リソースをビジネスイノベーションに集中させることができます。
安全、安定、高信頼性
厳格なテナント分離と詳細なアクセスコントロールシステムにより、金融グレードのセキュリティが保証されます。プラットフォームの安定性はエンタープライズ規模で実証されており、Alibaba Group のグローバルショッピングフェスティバルなどのイベント中のピーク負荷を処理します。
対象ユーザーと代表的な顧客
技術担当者: コアとなるデータ開発とモデリング作業を行うデータエンジニアとアルゴリズムエンジニア。
ビジネス担当者: セルフサービスのデータクエリと分析を行う運用スペシャリストと BI アナリスト。
管理担当者: データガバナンスとコンプライアンスコントロールを担当するデータ資産管理者とデータセキュリティ担当者。
DataWorks は、公共サービス、金融、小売、インターネット、自動車、製造など、さまざまな業界の顧客にサービスを提供しています。代表的な顧客は次のとおりです。
中国国家電網のビッグデータセンター: DataWorks を使用して、本社と 27 の省/市企業からのペタバイト規模のデータを一元管理しています。そのエンドツーエンドのデータプラットフォームガバナンスと監視システムは、全体的なデジタルトランスフォーメーションを加速します。
Fortune 500 企業であるモンデリーズ・チャイナ: DataWorks のインテリジェントなデータモデリングを活用して、エンドツーエンドのデータガバナンスを実現しています。これにより、データプラットフォームのセルフサービス機能が大幅に強化され、分散型のデータ駆動型意思決定とデジタルリテールトランスフォーメーションが可能になりました。
上場企業 iDreamSky: 自社開発のスケジューリングシステムを、オープンソースの EMR エンジンをベースにした DataWorks に置き換えました。これにより、同社の技術スタッフはビジネス運用により集中できるようになり、ゲームにおけるデータ駆動型の意思決定をサポートしています。
詳細については、「顧客事例」をご参照ください。
利用開始
サービスの有効化
DataWorks は、Chrome 69 以降を搭載した PC でのみ使用できます。
ほとんどのエンタープライズユーザーにとって、コアとなるデータ開発とガバナンス機能の大部分をカバーする Professional Edition で DataWorks サービスを有効化することから始めるのが最適です。
購入前に、「課金の概要」、「購入ガイド」、「エディションの選択と課金」をご参照ください。
ラーニングパス
DataWorks ドキュメントのホームページにある ラーニングパス を使用して、その概念、基本操作、および高度な機能をすばやく理解してください。

製品サポート
プリセールスおよびアフターセールスに関するお問い合わせは、チケットを送信してください。
付録: DataWorks の進化
Alibaba Group 内での開発履歴
2009 年の設立以来、DataWorks は Alibaba のビジネス運用とともに進化してきました。MaxCompute や Hologres などのビッグデータコンピューティングエンジンの機能を活用することで、複数の技術段階を経て進化し、Alibaba のデータプラットフォームとデータガバナンスイニシアチブの発展をサポートしてきました。現在、DataWorks は Alibaba Group 内で 50,000 人以上のデイリーアクティブユーザーを抱えており、これは平均して従業員の 3 人に 1 人が使用していることを意味します。300 以上のデータアプリケーションをサポートし、Alibaba Group 全体で 100 以上の業務部門にサービスを提供しています。
フェーズ (年) | テーマ | ビジネスの発展 | プラットフォームの発展 |
フェーズ 1 (2012) | 多様なビジネスの成長とデータ価値の発見 | 1688、AliExpress、Taobao、eTao など、複数のビジネスチームが並行して発展しました。 | デジタルトランスフォーメーションをサポートするために、さまざまなデータプラットフォームが共存していました:
|
フェーズ 2 (2015) | 垂直的なビジネスサイロの出現 | 垂直的なビジネスの発展:
| データプラットフォームを統一するための「月面着陸計画」が開始されました:
|
フェーズ 3 (2018) | データプラットフォームが持続可能なビジネス成長をサポート | データ駆動型のビジネス開発:
| データプラットフォームの構築と資産化:
|
フェーズ 4 (2021) | ビジネスとともに成長するクラウドデータプラットフォーム | ビジネスとデータの深い統合による完全なクラウドネイティブ:
| データプラットフォームがビジネスに貢献し、ポジティブなフィードバックループを形成:
|
Alibaba Cloud での開発履歴
DataWorks は 2015 年に Alibaba Cloud で正式に開始され、長年のビッグデータの専門知識をクラウドの顧客に提供しました。機能の継続的な反復を通じて、DataWorks はさまざまな業界の顧客やパートナーと協力しています。エンドツーエンドのデータガバナンスを提供することで、顧客がデータを効果的に管理および使用できるようにし、データ品質と効率の向上を支援します。
年 | マイルストーン | 説明 |
2009 | Alibaba Group で DataWorks プロジェクトが開始 | 社内の DataX データ同期エンジンとタスクスケジューリングエンジンを開発し、超大規模な Hadoop クラスターにサービスを提供しました。 |
2013 | 「月面着陸計画」が開始され、技術スタックが変革 | コードネーム: 月面着陸計画。グループはプラットフォーム統一計画を開始し、Hadoop から MaxCompute へ完全に移行しました。DataWorks は MaxCompute に完全に対応するように適合されました。 |
2015 | DataWorks がクラウドで正式に開始 | コードネーム: Shujia Platform。「Shujia Platform」のコアプロダクトとして、DataWorks はパブリッククラウド市場に参入し、企業や政府の顧客へのサービス提供を開始しました。 |
2017 | 国際展開 | 世界中の 12 以上の Alibaba Cloud リージョンでデプロイメントを完了し、グローバルな顧客へのサービス提供を開始しました。 |
2018 | DataWorks V2.0 がリリース | データ統合、データ開発、データサービス、アプリケーション開発をカバーする、ワンストップのインテリジェントなビッグデータクラウド R&D プラットフォームに進化しました。 |
2019 | DataWorks V3.0 がリリース | 複数のコンピューティングエンジンからのタスクのハイブリッドオーケストレーションをサポートし、新しい包括的なデータガバナンスシステムを導入しました。 |
2020 | 完全なオープン化とエコシステムの構築 | パートナーエコシステムを構築するための新しいオープンプラットフォームを開始しました。Forrester Wave™ for Cloud Data Warehouses で Strong Performer として認められました。 |
2022 | データガバナンス機能のアップグレード | 「データモデリングおよびガバナンスセンター」製品を開始しました。中国のデータガバナンス市場で市場シェア第 1 位を達成しました (IDC)。 |
2024 | AIGC を採用し、新しい Data+AI 機能をリリース | コアリリース: Copilot。データ開発および分析機能をアップグレードし、Copilot 製品をリリースし、OpenLake レイクハウスアーキテクチャに基づいたエンドツーエンドの Data+AI 開発およびガバナンスを提供しました。 |