Tutorial ini menunjukkan cara menggunakan portofolio produk DataWorks dan MaxCompute untuk pengembangan dan analisis data, dengan skenario analisis persona pengguna sebagai contoh untuk mendemonstrasikan kemampuan modul-modul DataWorks seperti Data Integration, Data Studio, dan Operation Center.
Pendahuluan
Untuk menyusun strategi bisnis yang lebih baik, Anda dapat menganalisis perilaku pengguna di situs web Anda. Analisis ini membantu membangun persona pengguna dasar berdasarkan data seperti atribut geografis dan sosial. Selanjutnya, Anda dapat menjalankan analisis terjadwal untuk operasi lalu lintas detail halus. Portofolio produk DataWorks dan MaxCompute memungkinkan Anda melakukan sinkronisasi, transformasi, pengelolaan, dan konsumsi data.
Sebelum mengikuti tutorial ini, baca Tujuan dan desain tutorial untuk memahami alur keseluruhan analisis persona pengguna.
Data Studio
Tutorial ini menggunakan platform DataStudio baru di DataWorks. Pastikan DataStudio baru diaktifkan untuk ruang kerja Anda. Anda dapat mengaktifkannya dengan cara berikut:
Saat membuat ruang kerja, pilih Use Data Studio (New Version).
Untuk meningkatkan dari versi DataStudio lama, klik tombol Upgrade di bagian atas antarmuka, lalu ikuti petunjuk di layar untuk menyelesaikan peningkatan tersebut.
Mulai 18 Februari 2025, DataStudio baru akan diaktifkan secara default saat akun Alibaba Cloud mengaktifkan DataWorks dan membuat ruang kerja untuk pertama kalinya di wilayah-wilayah berikut:
China (Hangzhou), China (Shanghai), China (Beijing), China (Zhangjiakou), China (Ulanqab), China (Shenzhen), China (Chengdu), China (Hong Kong), Jepang (Tokyo), Singapura, Malaysia (Kuala Lumpur), Indonesia (Jakarta), Thailand (Bangkok), Jerman (Frankfurt), Inggris (London), AS (Silicon Valley), AS (Virginia)
Prosedur
Buat Proyek MaxCompute dan ruang kerja DataWorks yang diperlukan, lalu konfigurasikan jaringan untuk kelompok sumber daya.
Di DataWorks, konfigurasikan Tugas sinkronisasi data untuk menyinkronkan data informasi pengguna dan log situs web ke MaxCompute, lalu kueri data yang telah disinkronkan.
Gunakan node SQL MaxCompute di DataWorks untuk mentransformasi data dalam tabel informasi pengguna dan log akses sehingga menghasilkan data persona pengguna target.
Konfigurasikan aturan pemantauan kualitas data untuk tabel-tabel hasil transformasi guna mendeteksi dan memblokir data kotor sedini mungkin agar tidak memengaruhi data hilir.
Setelah alur Tugas analisis persona pengguna selesai, tabel data terkait dibuat di MaxCompute. Anda dapat melihat tabel-tabel tersebut di modul Data Map serta hubungan antar tabel melalui alur data.
Konsumsi Data
Setelah analisis persona pengguna selesai, gunakan modul Analisis Data untuk membuat visualisasi data dari data yang telah diproses, sehingga Anda dapat dengan cepat mengambil informasi penting dan memperoleh wawasan mengenai tren bisnis di balik data tersebut.
Setelah memperoleh data hasil pemrosesan akhir, Anda dapat menggunakan modul Studio Layanan Data untuk berbagi dan menerapkan data melalui antarmuka layanan data API terstandarisasi guna menyediakan data kepada modul bisnis lain yang menerima data melalui API.