Tutorial ini menyediakan contoh persona pengguna di wilayah China (Shanghai) dan menunjukkan cara menggunakan DataWorks untuk sinkronisasi data, transformasi data, serta pemantauan kualitas. Untuk menyelesaikan tutorial ini, Anda harus menyiapkan proyek MaxCompute dan ruang kerja DataWorks yang diperlukan, serta mengonfigurasi sumber data, sumber daya komputasi, dan penyimpanan yang dibutuhkan.
Latar Belakang Bisnis
Menganalisis perilaku pengguna di situs web Anda sangat penting untuk menyusun strategi bisnis yang efektif. Analisis ini menghasilkan data profil pengguna dasar, termasuk atribut geografis dan sosial. Anda kemudian dapat menjadwalkan analisis persona secara berkala untuk melakukan operasi detail halus terhadap lalu lintas situs web Anda.
Prasyarat
Sebelum memulai, baca Pengantar eksperimen untuk memahami alur kerja lengkap studi kasus analisis persona pengguna.
Catatan
Studi kasus ini menyediakan informasi pengguna dan data uji akses situs web yang diperlukan. Anda dapat langsung menggunakan data ini.
Data dalam studi kasus ini merupakan data tiruan yang disediakan hanya untuk latihan praktis menggunakan aplikasi DataWorks.
Tutorial ini menggunakan DataStudio (versi lama) untuk transformasi data.
Siapkan lingkungan MaxCompute
1. Aktifkan MaxCompute
Studi kasus ini memerlukan MaxCompute. Pastikan Anda telah mengaktifkan MaxCompute. Gunakan parameter berikut untuk mengaktifkan layanan di wilayah China (Shanghai).
Region: Tiongkok (Shanghai)
Specifications Type: Standard computing resources.
2. Buat proyek MaxCompute
Dalam ruang kerja DataWorks standar, Anda harus menyambungkan dua proyek MaxCompute. Satu proyek berfungsi sebagai sumber daya komputasi untuk lingkungan pengembangan, sedangkan proyek lainnya berfungsi sebagai sumber daya komputasi untuk lingkungan produksi.
Buka Konsol MaxCompute. Di panel navigasi sebelah kiri, pilih .
Klik Create Project untuk membuat dua proyek MaxCompute. Tabel berikut menjelaskan parameter utama untuk tutorial ini. Anda dapat menggunakan nilai default untuk parameter lainnya. Untuk informasi lebih lanjut, lihat Buat proyek MaxCompute.
Item Konfigurasi
Konfigurasi
Project Name
Kustom. Harus unik secara global.
Contoh untuk tutorial ini:
Lingkungan produksi:
workshop2024_01.Lingkungan pengembangan:
workshop2024_01_dev.
Billing Method
Untuk tutorial ini, pilih Bayar Sesuai Pemakaian.
Default Quota
Untuk tutorial ini, pilih Default Pay-as-you-go Quota dari daftar drop-down.
Data Type Edition
Untuk tutorial ini, pilih Data Type 2.0 (Recommended) dari daftar drop-down.
Storage Encryption
Untuk tutorial ini, pilih Tidak Dienkripsi.
Untuk informasi lebih lanjut tentang cara membuat proyek MaxCompute, lihat Buat proyek MaxCompute.
Siapkan lingkungan DataWorks
Sebelum menggunakan DataWorks untuk pengembangan, pastikan Anda telah mengaktifkan layanan DataWorks. Untuk informasi lebih lanjut, lihat Panduan pembelian.
1. Buat ruang kerja
Login ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah China (Shanghai). Di panel navigasi sebelah kiri, klik Workspace untuk membuka halaman Workspaces.
Klik Create Workspace. Pilih Isolate Development and Production Environments. Jangan pilih Use Data Studio (New Version).
Mulai 18 Februari 2025, jika Anda mengaktifkan DataWorks dan membuat ruang kerja di wilayah China (Shanghai) untuk pertama kalinya, versi baru DataStudio akan diaktifkan secara default. Parameter Use Data Studio (New Version) tidak akan ditampilkan. Jika versi baru DataStudio sudah diaktifkan secara default untuk Anda, lihat Coba versi baru DataStudio.
Untuk informasi lebih lanjut tentang cara membuat ruang kerja, lihat Buat ruang kerja.
2. Buat kelompok sumber daya Serverless
Tutorial ini mengharuskan Anda menyinkronkan data dari OSS dan MySQL ke MaxCompute. Tugas sinkronisasi dijalankan pada kelompok sumber daya Serverless DataWorks. Oleh karena itu, Anda harus membeli kelompok sumber daya Serverless dan menyelesaikan persiapan yang diperlukan.
Beli kelompok sumber daya Serverless.
Tutorial ini memerlukan kelompok sumber daya Serverless DataWorks untuk sinkronisasi data dan penjadwalan. Anda harus membeli kelompok sumber daya Serverless dan menyelesaikan persiapan yang diperlukan.
Login ke halaman DataWorks - Resource Groups. Di bilah navigasi atas, ubah wilayah ke China (Shanghai). Di panel navigasi sebelah kiri, klik Resource Group untuk membuka halaman Resource Groups.
Klik Create Resource Group. Di halaman pembelian kelompok sumber daya, atur Region and Zone menjadi China (Shanghai) dan tentukan Resource Group Name. Konfigurasikan parameter lainnya dan selesaikan pembayaran sesuai petunjuk. Untuk informasi lebih lanjut tentang penagihan kelompok sumber daya Serverless, lihat Penagihan kelompok sumber daya Serverless.
CatatanJika tidak tersedia virtual private cloud (VPC) atau vSwitch di wilayah saat ini, Anda dapat mengklik tautan konsol dalam deskripsi parameter untuk membuatnya. Untuk informasi lebih lanjut tentang VPC dan vSwitch, lihat Apa itu VPC?.
Hubungkan kelompok sumber daya ke ruang kerja DataWorks.
Kelompok sumber daya Serverless yang baru dibeli harus disambungkan ke ruang kerja sebelum dapat digunakan.
Login ke halaman DataWorks - Resource Groups. Di bilah navigasi atas, ubah wilayah ke China (Shanghai). Temukan kelompok sumber daya Serverless yang telah Anda beli. Di kolom Actions, klik Associate Workspace. Lalu, klik Associate di sebelah ruang kerja DataWorks yang telah Anda buat.
Konfigurasikan akses Internet untuk kelompok sumber daya.
Data uji untuk tutorial ini diambil dari Internet. Secara default, kelompok sumber daya tidak dapat mengakses Internet. Anda harus mengonfigurasi Gateway NAT Internet untuk VPC yang disambungkan ke kelompok sumber daya dan menambahkan elastic IP addresses (EIPs). Hal ini menghubungkan VPC ke Internet sehingga dapat mengambil data tersebut.
Login ke Konsol VPC - Internet NAT Gateway. Di bilah menu atas, pilih wilayah China (Shanghai).
Klik Create Internet NAT Gateway dan konfigurasikan parameter-parameter tersebut. Tabel berikut menjelaskan parameter utama untuk tutorial ini. Untuk semua parameter lainnya, gunakan nilai default.
Parameter
Nilai
Region
Tiongkok (Shanghai).
Network and Zone
Pilih VPC dan vSwitch yang disambungkan ke kelompok sumber daya.
Anda dapat membuka Konsol DataWorks, mengubah wilayah, lalu mengklik Resource Group di panel navigasi sebelah kiri. Temukan kelompok sumber daya yang telah Anda buat dan klik Network Settings di kolom Actions. Di bagian Data Scheduling & Data Integration, lihat VPC dan vSwitch yang terkait. Untuk informasi lebih lanjut tentang VPC dan vSwitch, lihat Apa itu VPC?.
Network Type
Internet NAT Gateway.
EIP
Beli EIP Baru.
Create Service-linked Role
Saat pertama kali membuat Gateway NAT, Anda harus membuat peran terkait layanan. Klik Create Service-linked Role.
Klik Buy Now, terima ketentuan layanan, lalu klik Activate Now untuk menyelesaikan pembelian.
Untuk informasi lebih lanjut tentang cara menambahkan dan menggunakan kelompok sumber daya Serverless, lihat Gunakan kelompok sumber daya Serverless.
3. Hubungkan proyek MaxCompute
Anda harus menyambungkan proyek MaxCompute yang telah Anda buat ke ruang kerja DataWorks sebagai sumber daya komputasi. Hal ini memungkinkan Anda memproses data di MaxCompute menggunakan modul Pengembangan Data.
Buka halaman DataWorks - Workspaces. Di bilah navigasi atas, ubah wilayah ke China (Shanghai). Temukan ruang kerja Anda dan klik namanya untuk membuka halaman Workspace Details.
Di panel navigasi sebelah kiri, klik Computing Resource. Anda akan diarahkan ke halaman .
Klik Create Computing Resource. Pilih Jenis sumber daya komputasi dan konfigurasikan parameter untuk menyambungkan sumber daya tersebut.
Tutorial ini menggunakan MaxCompute sebagai sumber daya komputasi dan penyimpanan. Tabel berikut menjelaskan parameter utama lainnya. Untuk semua parameter lainnya, gunakan nilai default.
Parameter
Deskripsi
Data Source Name
Nama kustom. Nama ini mengidentifikasi sumber daya komputasi. Saat waktu proses, nama instans sumber daya komputasi digunakan untuk memilih sumber daya komputasi bagi tugas tersebut.
Alibaba Cloud Account
Pilih Current Alibaba Cloud Account.
Region
Pilih wilayah yang sama dengan ruang kerja DataWorks saat ini: China (Shanghai).
MaxCompute Project Name
Pilih proyek MaxCompute yang akan disambungkan. Untuk tutorial ini, sambungkan proyek MaxCompute yang sesuai yang dibuat di Langkah 2 ke lingkungan produksi dan pengembangan.
Default Access Identity
Menentukan identitas yang digunakan untuk mengakses proyek MaxCompute di ruang kerja saat ini.
Lingkungan pengembangan: Hanya identitas Executor yang didukung.
Lingkungan produksi: Pilih identitas dari daftar tarik-turun berdasarkan akun login saat ini. Untuk tutorial ini, pilih Alibaba Cloud Account.
CatatanJika Anda login dengan identitas berbeda, lihat Versi baru DataStudio: Menyambungkan mesin komputasi MaxCompute untuk detail konfigurasi.
Connection Configuration
Kelompok sumber daya yang digunakan untuk menghubungkan ke sumber daya komputasi MaxCompute. Kelompok sumber daya Serverless yang telah Anda buat dan sambungkan ke ruang kerja saat ini akan ditampilkan di sini. Anda harus menguji konektivitas untuk lingkungan pengembangan maupun produksi.
Klik Create and Associate Computing Resource with DataStudio.
Ikuti petunjuk di halaman tersebut. Setelah Anda memperbarui halaman sumber daya komputasi untuk Pengembangan Data, sumber daya komputasi MaxCompute yang disambungkan akan ditampilkan.
CatatanJika status sumber daya komputasi MaxCompute belum terhubung, klik Associate.
Langkah selanjutnya
Sekarang Anda telah menyiapkan lingkungan, Anda dapat melanjutkan ke tutorial berikutnya. Dalam tutorial berikutnya, Anda akan mempelajari cara menyinkronkan informasi pengguna dasar dan log akses situs web ke MaxCompute. Untuk informasi lebih lanjut, lihat Sinkronisasi data.