DataWorks adalah platform data komprehensif yang terintegrasi dengan layanan big data dan AI seperti MaxCompute, E-MapReduce, Hologres, Realtime Compute for Apache Flink, AnalyticDB, StarRocks, dan PAI. Platform ini menyediakan kemampuan integrasi, pengembangan, tata kelola, dan analitik data ujung ke ujung untuk arsitektur data modern termasuk gudang data, data lake, dan lakehouse. Dibangun berdasarkan metodologi big data terbukti dari Alibaba Group sejak 2009, DataWorks membantu perusahaan mengelola seluruh siklus hidup data dan digunakan oleh ribuan pelanggan di berbagai sektor seperti keuangan, ritel, dan manufaktur untuk mendorong transformasi digital.
Kemampuan
DataWorks menyediakan serangkaian fitur canggih untuk merampingkan alur kerja data di seluruh siklus hidup data. Kemampuan ini diorganisasikan dalam enam modul inti yang mencakup segala sesuatu mulai dari pemodelan data dan integrasi hingga keamanan dan analitik.
Modul inti | Fitur utama |
Secara sistematis merancang dan mengelola aset gudang data yang distandardisasi dan dapat digunakan kembali. | |
Mengaktifkan sinkronisasi data waktu nyata dan offline antara berbagai sumber di lingkungan cloud atau on-premises. | |
Mengembangkan tugas batch, stream, dan pembelajaran mesin dalam IDE online dengan dukungan untuk SQL, Spark, dan Python. Mengonfigurasi dependensi tugas kompleks dan jadwal. | |
Mengatur aset data dengan fitur seperti Kualitas Data, Peta Data, dan Tata Kelola Aset Data untuk menentukan aturan kualitas, melacak alur data, dan mengelola katalog data Anda. | |
Memastikan kepatuhan dan keamanan data di seluruh siklus hidup data dengan fitur seperti penyamaran data, kontrol akses detail halus, dan audit keamanan. | |
Layanan analitik data | Menjalankan analisis interaktif dan mendapatkan wawasan bisnis menggunakan alat seperti SQL Query dan Smart Data Discovery. Hasilkan API data berkinerja tinggi tanpa kode untuk integrasi aplikasi yang lancar. |
Keunggulan
Fitur komprehensif dan performa luar biasa
Platform ini mencakup seluruh siklus hidup data, mulai dari integrasi dan pengembangan hingga tata kelola dan layanan. Dengan desain berperforma tinggi, platform ini mampu memproses petabyte data setiap hari serta menjadwalkan jutaan tugas kompleks untuk menangani beban kerja perusahaan berskala besar yang menuntut.
Cerdas dan mudah digunakan
Antarmuka pengguna grafis yang lengkap dan IDE web yang fleksibel membantu mempercepat proses pembelajaran. Dengan dukungan untuk SQL dan Python, serta fitur Copilot cerdas bawaan untuk pembuatan kode dan Q&A pintar, baik pengguna baru maupun berpengalaman dapat bekerja secara produktif dalam waktu singkat.
Ekonomis dan siap pakai
Arsitektur cloud-native yang sepenuhnya dikelola menyediakan kemampuan pengembangan dan tata kelola data secara langsung. Model ini secara signifikan mengurangi biaya R&D dan O&M terkait dengan platform buatan sendiri, sehingga membebaskan sumber daya untuk fokus pada inovasi bisnis.
Aman, stabil, dan andal
Keamanan tingkat keuangan dijamin melalui isolasi penyewa yang ketat dan sistem kontrol akses detail halus. Stabilitas platform telah terbukti pada skala perusahaan, mampu menangani beban puncak selama acara seperti Festival Belanja Global Alibaba Group.
Pengguna target dan pelanggan tipikal
Tenaga Teknis: Insinyur data dan insinyur algoritma yang melakukan pekerjaan pengembangan dan pemodelan data inti.
Tenaga Bisnis: Spesialis operasi dan analis BI yang melakukan kueri data mandiri dan analisis.
Personel Manajemen: Administrator aset data dan petugas keamanan data yang menangani tata kelola data dan kontrol kepatuhan.
DataWorks melayani pelanggan di berbagai industri, termasuk layanan publik, keuangan, ritel, internet, otomotif, dan manufaktur. Pelanggan tipikal termasuk:
Pusat Big Data China State Grid: Menggunakan DataWorks untuk mengelola data petabyte dari kantor pusat dan 27 perusahaan provinsi/kota. Sistem tata kelola dan pemantauan platform data end-to-end mempercepat transformasi digital secara keseluruhan.
Perusahaan Fortune 500 Mondelēz China: Memanfaatkan pemodelan data cerdas DataWorks untuk tata kelola data end-to-end. Hal ini secara signifikan meningkatkan kemampuan mandiri platform datanya, memungkinkan pengambilan keputusan berbasis data yang terdesentralisasi dan transformasi ritel digital.
Perusahaan Terdaftar iDreamSky: Mengganti sistem penjadwalan mandirinya dengan DataWorks berdasarkan mesin EMR open-source. Ini memungkinkan staf teknis perusahaan lebih fokus pada operasi bisnis, mendukung keputusan berbasis data dalam gaming.
Untuk lebih banyak cerita pelanggan, lihat Studi Kasus Pelanggan.
Memulai
Aktifkan layanan
DataWorks hanya dapat digunakan di PC dengan Chrome 69 atau versi lebih baru.
Untuk sebagian besar pengguna perusahaan, sebaiknya mulai dengan mengaktifkan layanan DataWorks dengan Edisi Profesional, yang mencakup sebagian besar fitur pengembangan dan tata kelola data inti.
Sebelum melakukan pembelian, lihat Ikhtisar Penagihan, Panduan Pembelian, dan Edisi dan Penagihan.
Jalur pembelajaran
Gunakan jalur pembelajaran di halaman utama dokumentasi DataWorks untuk dengan cepat memahami konsep, operasi dasar, dan fitur lanjutan.

Dukungan produk
Anda dapat mengirim tiket untuk pertanyaan pra-penjualan dan pasca-penjualan.
Lampiran: Evolusi DataWorks
Sejarah pengembangan di dalam Alibaba Group
Sejak didirikan pada tahun 2009, DataWorks telah berkembang bersama operasi bisnis Alibaba. Dengan memanfaatkan kemampuan mesin komputasi big data seperti MaxCompute dan Hologres, ia telah melewati beberapa tahap teknologi, mendukung pengembangan platform data dan inisiatif tata kelola data Alibaba. Saat ini, DataWorks memiliki lebih dari 50.000 pengguna aktif harian di dalam Alibaba Group, artinya rata-rata satu dari tiga karyawan menggunakannya. Ini mendukung lebih dari 300 aplikasi data dan melayani lebih dari 100 unit bisnis di seluruh Alibaba Group.
Fase (Tahun) | Tema | Pengembangan Bisnis | Pengembangan Platform |
Fase 1 (2012) | Pertumbuhan Bisnis Beragam dan Penemuan Nilai Data | Banyak tim bisnis dikembangkan secara paralel, termasuk 1688, AliExpress, Taobao, dan eTao. | Berbagai platform data berkoeksistensi untuk mendukung transformasi digital:
|
Fase 2 (2015) | Silo Bisnis Vertikal Muncul | Pengembangan bisnis vertikal:
| Rencana Moon Landing diluncurkan untuk menyatukan platform data:
|
Fase 3 (2018) | Platform Data Mendukung Pertumbuhan Bisnis Berkelanjutan | Pengembangan bisnis berbasis data:
| Konstruksi platform data dan asetisasi:
|
Fase 4 (2021) | Platform Data Cloud Tumbuh Bersama Bisnis | Sepenuhnya cloud-native dengan integrasi bisnis dan data yang mendalam:
| Platform data melayani bisnis, menciptakan loop umpan balik positif:
|
Sejarah pengembangan di Alibaba Cloud
DataWorks secara resmi diluncurkan di Alibaba Cloud pada tahun 2015, membawa keahlian big data bertahun-tahun kepada pelanggan cloud. Melalui iterasi berkelanjutan dari kemampuannya, DataWorks berkolaborasi dengan pelanggan dan mitra di berbagai industri. Dengan menyediakan tata kelola data end-to-end, solusi ini memungkinkan pengelolaan dan pemanfaatan data secara efektif, serta membantu pelanggan meningkatkan kualitas dan efisiensi data.
Tahun | Tonggak Sejarah | Deskripsi |
2009 | Proyek DataWorks dimulai di Alibaba Group | Mengembangkan mesin sinkronisasi data internal DataX dan mesin penjadwalan tugas untuk melayani kluster Hadoop skala ultra-besar. |
2013 | "Rencana Moon Landing" dimulai; transformasi tumpukan teknologi | Nama sandi: Rencana Moon Landing. Grup meluncurkan rencana unifikasi platform, sepenuhnya bermigrasi dari Hadoop ke MaxCompute. DataWorks diadaptasi untuk sepenuhnya melayani MaxCompute. |
2015 | DataWorks secara resmi diluncurkan di cloud | Nama sandi: Platform Shujia. Sebagai produk inti dari "Platform Shujia", DataWorks memasuki pasar cloud publik dan mulai melayani pelanggan perusahaan dan pemerintah. |
2017 | Ekspansi internasional | Menyelesaikan penyebaran di lebih dari 12 wilayah Alibaba Cloud di seluruh dunia dan mulai melayani pelanggan global. |
2018 | DataWorks V2.0 dirilis | Berkembang menjadi platform R&D big data cloud cerdas satu atap, mencakup integrasi data, pengembangan data, layanan data, dan pengembangan aplikasi. |
2019 | DataWorks V3.0 dirilis | Mendukung orkestrasi hibrida tugas dari berbagai mesin komputasi dan memperkenalkan sistem tata kelola data komprehensif baru. |
2020 | Keterbukaan penuh dan pembangunan ekosistem | Meluncurkan platform terbuka baru untuk membangun ekosistem mitra. Diakui sebagai Strong Performer dalam Forrester Wave™ untuk Gudang Data Cloud. |
2022 | Kemampuan tata kelola data ditingkatkan | Meluncurkan produk "Pusat Pemodelan dan Tata Kelola Data". Mencapai pangsa pasar nomor satu di pasar tata kelola data Tiongkok (IDC). |
2024 | Mengadopsi AIGC, meluncurkan kemampuan baru Data+AI | Rilis inti: Copilot. Kemampuan pengembangan dan analisis data ditingkatkan, produk Copilot dirilis, dan menyediakan pengembangan serta tata kelola Data+AI end-to-end berdasarkan arsitektur lakehouse OpenLake. |
Informasi lebih lanjut
Konsep DataWorks dan Ekosistem Produk: Istilah dan Ekosistem Produk.