DataWorks menyediakan solusi bagi perusahaan dari berbagai industri untuk mengatasi tantangan terkait data dan menambang nilai data. Topik ini menjelaskan studi kasus pelanggan tipikal yang menggunakan DataWorks.
Industri ritel baru: Mid-end data cloud untuk RT-Mart

Latar Belakang
Untuk mendukung transformasi digital dan memperluas ke pasar ritel baru, RT-Mart berencana memindahkan seluruh sistem IT-nya ke Alibaba Cloud dalam dua tahun, menggantikan pusat data yang dikelola sendiri. Perusahaan juga ingin membangun mid-end data cloud untuk mengurangi total biaya kepemilikan (TCO) serta memfasilitasi kontrol loop tertutup aset data melalui ekosistem cloud.
Permintaan Pelanggan
Sistem lama RT-Mart dibangun di atas Hadoop open source, yang tidak stabil dan memiliki biaya pemeliharaan tinggi untuk perangkat lunak dan keras. Hal ini memengaruhi operasi bisnis dan analitik secara signifikan.
Dengan pertumbuhan pesat bisnis online, banyak permintaan belum terpenuhi. RT-Mart membutuhkan solusi fleksibel yang dapat memperluas teknologi yang ada untuk mendukung pertumbuhan bisnis.
Embodiment Nilai
Solusi ini menggunakan MaxCompute Migration Assist (MMA) untuk memindahkan lebih dari 400 TB data historis ke cloud dalam 15 hari dengan akurasi tinggi, memberikan pengalaman migrasi data yang efisien. Selain itu, solusi ini memanfaatkan DataWorks dan MaxCompute untuk meningkatkan efisiensi pengembangan data secara signifikan serta membangun mid-end data untuk RT-Mart.
Industri keuangan baru: Danau data gudang untuk perusahaan keuangan Internet

Latar Belakang
Perusahaan membangun danau data primitif berbasis Hadoop dan Object Storage Service (OSS), tetapi menggunakan MaxCompute untuk menjalankan tugas dan menyimpan data di mid-end data. Dua set mesin heterogen menyebabkan masalah seperti redundansi penyimpanan, inkonsistensi metadata dan izin, serta interupsi perhitungan.
Permintaan Pelanggan
Perusahaan ingin menggunakan mesin MaxCompute dan E-MapReduce (EMR) untuk menyesuaikan kebutuhan skenario bisnis yang berbeda, menggunakan Alibaba Cloud Data Lake Formation (DLF) untuk mengelola metadata dan izin pengguna secara terpusat, serta menggunakan DataWorks untuk mengatur data dari ujung ke ujung guna meningkatkan kualitas dan aplikasi data.
Embodiment Nilai
Solusi ini mengintegrasikan metadata mesin EMR ke dalam DLF, menggunakan OSS sebagai lapisan bawah untuk penyimpanan data terpadu, serta membangun danau data gudang yang menghubungkan danau data berbasis EMR ke gudang data berbasis MaxCompute. Dengan cara ini, data dapat mengalir bebas dan perhitungan dapat dilakukan tanpa gangguan antara danau data dan gudang data.
Solusi ini menyimpan data dari danau data dan gudang data pada lapisan yang berbeda. Secara spesifik, tabel antara yang digunakan oleh mid-end data untuk pemodelan dimensional disimpan di danau data MaxCompute, sementara data yang digunakan oleh EMR dan mesin lainnya disimpan di lapisan layanan data aplikasi (ADS).
Industri energi baru: Tata kelola data dari ujung ke ujung berbasis DataWorks untuk perusahaan energi

Latar Belakang
Perusahaan memiliki beberapa anak perusahaan dan sejumlah besar sistem dengan jalur teknis kompleks dan beragam.
Data tersebar dan didefinisikan berdasarkan standar yang berbeda, menyebabkan celah data dan meningkatkan kesulitan analisis.
Tidak ada mekanisme efektif untuk manajemen izin data, tata kelola data, dan berbagi data.
Permintaan Pelanggan
Menggunakan DataWorks dan MaxCompute untuk membangun mid-end data guna mencegah silo data.
Menggunakan Realtime Compute for Apache Flink dan Hologres untuk meningkatkan kinerja real-time mid-end data.
Menggunakan DataWorks untuk mengatur data dari ujung ke ujung guna meningkatkan kualitas dan aplikasi data.
Perwujudan nilai
Solusi ini membantu membangun sistem pemasaran B2B cerdas yang mengintegrasikan manufaktur cerdas dengan pemasaran Internet.
Solusi ini menciptakan mid-end data yang mengintegrasikan pemrosesan data offline dan real-time, serta menyediakan rantai aplikasi big data seragam dan lengkap untuk mendukung sistem bisnis inti perusahaan.
Tata kelola data dari ujung ke ujung meningkatkan ketersediaan data, memastikan akurasi, kinerja real-time, dan konsistensi data, serta membantu perusahaan mengurangi biaya sekitar CNY 100 juta.
Solusi ini meningkatkan efisiensi iterasi bisnis, memungkinkan data diperbarui setiap 10 menit dan layanan baru dirilis dalam satu hari, dibandingkan dengan sistem asli yang memerlukan satu hari untuk memperbarui data dan satu minggu untuk merilis layanan baru.
Industri Internet: Gudang data besar cloud untuk GOGOX

Latar Belakang
GOGOX adalah platform logistik yang mengintegrasikan sumber daya transportasi idle menggunakan metode informasi digital seperti koneksi jaringan, berbagi sumber daya transportasi, digitalisasi proses, dan pencocokan cerdas. Platform ini melakukan analisis berdasarkan big data untuk mendistribusikan sumber daya transportasi secara tepat ke pasar yang dibutuhkan, menghemat energi, mengurangi emisi, dan menurunkan tingkat muatan kosong, serta meningkatkan efisiensi operasi dan memfasilitasi pengembangan logistik hijau.
Permintaan Pelanggan
Efisiensi pemrosesan data besar rendah, dan durasi untuk perhitungan data offline bervariasi.
Realtime Compute for Apache Flink memerlukan biaya pengembangan dan pemeliharaan besar. Perusahaan membutuhkan solusi untuk tata kelola gudang data komprehensif.
Embodiment Nilai
Platform big data Apsara dari Alibaba Cloud membantu GOGOX mengurangi biaya server lebih dari 30% dan meningkatkan efisiensi pengembangan data sebesar 100%. Dibandingkan dengan Apache Storm berbasis Java asli, Flink SQL telah sangat mengurangi siklus pengembangan komputasi real-time dan lebih mudah dipelihara. Selain itu, Flink SQL memastikan konsistensi data dan meningkatkan akurasi serta kinerja real-time pemantauan layanan, memungkinkan pengguna fokus lebih pada bisnis dan mempercepat transformasi real-time. Layanan O&M 24 jam dari Alibaba Cloud memastikan stabilitas kluster dan nol kegagalan.
Industri Internet: Gudang data besar cloud untuk Babytree

Latar Belakang
Babytree, didirikan pada tahun 2007, adalah platform komunitas terbesar dan paling aktif untuk perawatan ibu dan bayi di Tiongkok. Sebagai salah satu platform komunitas berorientasi pelanggan pertama melalui Internet, Babytree memiliki pusat datanya sendiri sejak awal, dan skala pusat data ini berkembang pesat.
Permintaan Pelanggan
Pusat data memberikan kinerja buruk dan sulit dikelola. Perusahaan membutuhkan solusi yang mendukung tata kelola big data komprehensif.
Biaya tahunan pusat data tinggi. Perusahaan membutuhkan solusi yang dapat mengurangi biaya dan meningkatkan efisiensi.
Perwujudan Nilai
Solusi yang disediakan oleh Alibaba Cloud dikembangkan berdasarkan prinsip pengurangan biaya dan peningkatan efisiensi. Setelah data dipindahkan ke MaxCompute, Realtime Compute for Apache Flink, dan DataWorks, kinerja tugas tertentu meningkat lebih dari 10 kali lipat dan penyimpanan data berkurang dari 3 PB di sistem Hadoop yang dikelola sendiri menjadi 900 TB di cloud. Kemampuan pemrosesan data real-time dari Realtime Compute for Apache Flink memungkinkan pemrosesan real-time pada skenario yang ada dari Babytree dan memberikan rekomendasi real-time untuk meningkatkan tingkat konversi perilaku. Solusi ini membantu perusahaan mengurangi biaya keseluruhan lebih dari 30%.
Industri game: Operasi game full-link untuk DeNA China

Latar Belakang
DeNA adalah penyedia layanan game luar biasa. Karena siklus hidup proyek game semakin pendek, sistem operasi data hemat biaya, efisien, dan rinci diperlukan untuk mengelola setiap tahap proyek secara real-time dengan presisi.
Permintaan Pelanggan
Perusahaan memiliki dua kluster yang masing-masing berjalan pada Hadoop 1.0 dan 2.0, membuat arsitektur teknis kompleks dan mengurangi stabilitas, keamanan, serta kinerja penskalaan platform.
Perusahaan memiliki sumber log beragam dan permintaan tinggi untuk kinerja real-time. Saat volume log meningkat, kinerja dan stabilitas layanan pengumpulan log berbasis Fluentd sangat terpengaruh.
Pengembangan data didasarkan pada pengkodean manual. Efisiensi bisnis rendah dan kinerja komputasi berbasis Hive tidak dapat memenuhi persyaratan.
Embodiment Nilai
DeNA China adalah perusahaan pertama yang menggunakan Lightning Cube bersama dengan MMA di industri game. Sekitar 300-TB data tambahan dan 50-TB data historis yang terakumulasi dalam database RDS perusahaan selama 10 tahun berhasil dipindahkan ke cloud hanya dalam waktu lebih dari sebulan, bahkan tanpa penggunaan jalur sewaan. Proses ini secara teknis kompleks. Dibandingkan dengan sistem manajemen tugas asli yang menggunakan Airflow berbasis Python open source, DataWorks memberikan manfaat berikut:
Manajemen tugas disajikan dengan jelas. Jika terjadi kesalahan tugas, sistem dapat menemukan dan memperbaiki kesalahan pada kesempatan pertama.
Bisnis game memiliki ratusan sumber data. Sumber data ini dapat dikelola sekaligus tanpa upaya redundan dan dapat digunakan dalam berbagai layanan data.
DataWorks menyediakan berbagai fitur bagi pengguna untuk menjadwalkan sumber daya berdasarkan GUI tanpa upaya manual atau pengkodean tambahan, memungkinkan pengguna fokus lebih pada manajemen dan pengembangan.
Setelah data dipindahkan ke cloud, platform big data Apsara dari Alibaba Cloud membantu perusahaan mengelola operasi data di seluruh tautan penuh dari pengumpulan data, penyimpanan, dan komputasi, hingga analisis real-time atau offline.