Tutorial ini menjelaskan cara menggunakan portofolio produk DataWorks dan MaxCompute untuk pengembangan dan analisis data besar. Tutorial ini menggunakan contoh analisis profil pengguna untuk menunjukkan kemampuan DataWorks dalam Integrasi Data, Pengembangan Data, dan Pusat Operasi.
Ikhtisar tutorial
Untuk menyusun strategi bisnis yang lebih baik, Anda dapat memperoleh data profil dasar pengguna situs web dari perilaku daring mereka, termasuk atribut geografis dan sosial. Selanjutnya, Anda dapat melakukan analisis profil secara terjadwal guna mendukung operasi lalu lintas situs web dengan detail halus. Portofolio produk DataWorks dan MaxCompute memungkinkan Anda menyelesaikan sinkronisasi data, transformasi data, manajemen data, dan konsumsi data.
Untuk mengikuti tutorial ini, baca Tujuan dan desain tutorial guna memahami alur keseluruhan analisis persona pengguna.
Platform pengembangan data
Tutorial ini menggunakan versi sebelumnya dari DataStudio di DataWorks. Pastikan ruang kerja Anda tidak menggunakan New Version Of Data Studio.
Saat Anda membuat ruang kerja, jangan pilih opsi Use The New Data Development (DataStudio).
Mulai 18 Februari 2025, saat Anda menggunakan Akun Alibaba Cloud untuk mengaktifkan DataWorks dan membuat ruang kerja pertama kali di wilayah berikut, versi baru Data Studio akan diaktifkan secara default. Jika akun Anda menggunakan versi baru Data Studio secara default, lihat Mengalami versi baru Data Studio.
Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Zhangjiakou), Tiongkok (Ulanqab), Tiongkok (Shenzhen), Tiongkok (Chengdu), Tiongkok (Hong Kong), Jepang (Tokyo), Singapura, Malaysia (Kuala Lumpur), Indonesia (Jakarta), Thailand (Bangkok), Jerman (Frankfurt), Inggris (London), AS (Silicon Valley), AS (Virginia)
Prosedur
Buat proyek MaxCompute dan ruang kerja DataWorks yang diperlukan untuk tutorial ini, lalu lengkapi konfigurasi jaringan untuk kelompok sumber daya.
Di DataWorks, konfigurasikan tugas sinkronisasi data untuk menyinkronkan data informasi pengguna dan log situs web yang disediakan dalam tutorial ini ke MaxCompute, lalu kueri data yang telah disinkronkan.
Gunakan node SQL MaxCompute di DataWorks untuk mentransformasi data dalam tabel informasi pengguna dan tabel log akses yang telah disinkronkan ke MaxCompute, sehingga menghasilkan data profil pengguna target.
Konfigurasikan aturan pemantauan kualitas data untuk tabel hasil transformasi data guna membantu mengidentifikasi dan memblokir data kotor sedini mungkin, sehingga mencegah penyebaran dampaknya.
Setelah alur tugas analisis profil pengguna selesai, tabel data terkait akan dibuat di MaxCompute. Anda dapat melihat tabel tersebut di modul Peta Data dan memeriksa alur datanya untuk memahami hubungan antar tabel.
Konsumsi data
Setelah analisis profil pengguna selesai, Anda dapat menggunakan modul Analisis Data untuk memvisualisasikan data yang ditransformasi, sehingga memudahkan ekstraksi informasi penting dan memperoleh wawasan mengenai tren bisnis.
Setelah memperoleh data hasil transformasi akhir, Anda dapat menggunakan modul Studio Layanan Data untuk berbagi dan menggunakan data tersebut melalui layanan data API standar, sehingga menyediakan data kepada modul bisnis lain yang menerima data melalui API.