Pelajari cara menggunakan DataWorks dan MaxCompute untuk pengembangan data besar melalui studi kasus analisis persona pengguna yang mencakup Data Integration, Data Studio, dan Operation Center.
Pendahuluan
Analisis perilaku pengguna di situs web Anda untuk membangun persona pengguna berdasarkan atribut geografis dan sosial. Jadwalkan analisis berulang guna mendukung operasi traffic dengan detail halus. DataWorks dan MaxCompute menangani sinkronisasi data, transformasi, manajemen, serta konsumsi.
Sebelum memulai, baca Tujuan dan desain tutorial untuk ikhtisar alur kerja end-to-end.
Data Studio
Tutorial ini menggunakan Data Studio versi baru di DataWorks. Pastikan Data Studio versi baru diaktifkan untuk ruang kerja Anda. Untuk mengaktifkannya:
-
Saat Anda membuat ruang kerja, pilih Use Data Studio (New Version).
-
Untuk melakukan upgrade dari versi lama, klik Upgrading di bagian atas antarmuka dan ikuti petunjuknya.
-
Setelah 18 Februari 2025, DataWorks mengaktifkan Data Studio versi baru secara default untuk setiap Akun Alibaba Cloud yang membuat ruang kerja pertamanya di wilayah-wilayah berikut:
China (Hangzhou), China (Shanghai), China (Beijing), China (Zhangjiakou), China (Ulanqab), China (Shenzhen), China (Chengdu), China (Hong Kong), Jepang (Tokyo), Singapura, Malaysia (Kuala Lumpur), Indonesia (Jakarta), Thailand (Bangkok), Jerman (Frankfurt), Inggris (London), AS (Silicon Valley), AS (Virginia)
Prosedur
-
Buat Proyek MaxCompute dan ruang kerja DataWorks yang diperlukan, lalu konfigurasikan jaringan untuk kelompok sumber daya.
-
Konfigurasikan task sinkronisasi data untuk menyinkronkan informasi pengguna dan data log situs web ke MaxCompute, lalu kueri data tersebut.
-
Gunakan node SQL MaxCompute untuk mentransformasikan informasi pengguna dan data log akses menjadi data persona pengguna target.
-
Konfigurasikan aturan kualitas data untuk tabel hasil transformasi guna mendeteksi dan memblokir data kotor sebelum memengaruhi proses downstream.
-
Tabel hasil dibuat di MaxCompute. Lihat tabel tersebut di Peta Data dan gunakan alur data untuk melacak hubungan di antara mereka.
-
Konsumsi data
-
Gunakan modul analisis data untuk membuat visualisasi data dari data yang telah diproses guna mengekstraksi informasi penting dan mengidentifikasi tren bisnis.
-
Gunakan DataService Studio untuk mengekspos data yang telah diproses melalui layanan data API terstandarisasi, sehingga tersedia untuk modul bisnis downstream.
-