全部产品
Search
文档中心

DataWorks:Siapkan lingkungan

更新时间:Dec 12, 2025

Tutorial ini menyediakan contoh persona pengguna di wilayah China (Shanghai) dan menunjukkan cara menggunakan DataWorks untuk sinkronisasi data, transformasi data, serta pemantauan kualitas. Untuk menyelesaikan tutorial ini, Anda harus menyiapkan proyek MaxCompute dan ruang kerja DataWorks yang diperlukan, serta mengonfigurasi sumber data, sumber daya komputasi, dan penyimpanan yang dibutuhkan.

Latar Belakang Bisnis

Menganalisis perilaku pengguna di situs web Anda sangat penting untuk menyusun strategi bisnis yang efektif. Analisis ini menghasilkan data profil pengguna dasar, termasuk atribut geografis dan sosial. Anda kemudian dapat menjadwalkan analisis persona secara berkala untuk melakukan operasi detail halus terhadap lalu lintas situs web Anda.

Prasyarat

Sebelum memulai, baca Pengantar eksperimen untuk memahami alur kerja lengkap studi kasus analisis persona pengguna.

Catatan

  • Studi kasus ini menyediakan informasi pengguna dan data uji akses situs web yang diperlukan. Anda dapat langsung menggunakan data ini.

  • Data dalam studi kasus ini merupakan data tiruan yang disediakan hanya untuk latihan praktis menggunakan aplikasi DataWorks.

  • Tutorial ini menggunakan DataStudio (versi lama) untuk transformasi data.

Siapkan lingkungan MaxCompute

1. Aktifkan MaxCompute

Studi kasus ini memerlukan MaxCompute. Pastikan Anda telah mengaktifkan MaxCompute. Gunakan parameter berikut untuk mengaktifkan layanan di wilayah China (Shanghai).

  • Region: Tiongkok (Shanghai)

  • Specifications Type: Standard computing resources.

2. Buat proyek MaxCompute

Dalam ruang kerja DataWorks standar, Anda harus menyambungkan dua proyek MaxCompute. Satu proyek berfungsi sebagai sumber daya komputasi untuk lingkungan pengembangan, sedangkan proyek lainnya berfungsi sebagai sumber daya komputasi untuk lingkungan produksi.

  1. Buka Konsol MaxCompute. Di panel navigasi sebelah kiri, pilih Manage Configurations > Projects.

  2. Klik Create Project untuk membuat dua proyek MaxCompute. Tabel berikut menjelaskan parameter utama untuk tutorial ini. Anda dapat menggunakan nilai default untuk parameter lainnya. Untuk informasi lebih lanjut, lihat Buat proyek MaxCompute.

    Item Konfigurasi

    Konfigurasi

    Project Name

    Kustom. Harus unik secara global.

    Contoh untuk tutorial ini:

    • Lingkungan produksi: workshop2024_01.

    • Lingkungan pengembangan: workshop2024_01_dev.

    Billing Method

    Untuk tutorial ini, pilih Bayar Sesuai Pemakaian.

    Default Quota

    Untuk tutorial ini, pilih Default Pay-as-you-go Quota dari daftar drop-down.

    Data Type Edition

    Untuk tutorial ini, pilih Data Type 2.0 (Recommended) dari daftar drop-down.

    Storage Encryption

    Untuk tutorial ini, pilih Tidak Dienkripsi.

Untuk informasi lebih lanjut tentang cara membuat proyek MaxCompute, lihat Buat proyek MaxCompute.

Siapkan lingkungan DataWorks

Sebelum menggunakan DataWorks untuk pengembangan, pastikan Anda telah mengaktifkan layanan DataWorks. Untuk informasi lebih lanjut, lihat Panduan pembelian.

1. Buat ruang kerja

  1. Login ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah China (Shanghai). Di panel navigasi sebelah kiri, klik Workspace untuk membuka halaman Workspaces.

  2. Klik Create Workspace. Pilih Isolate Development and Production Environments. Jangan pilih Use Data Studio (New Version).

Catatan
  • Mulai 18 Februari 2025, jika Anda mengaktifkan DataWorks dan membuat ruang kerja di wilayah China (Shanghai) untuk pertama kalinya, versi baru DataStudio akan diaktifkan secara default. Parameter Use Data Studio (New Version) tidak akan ditampilkan. Jika versi baru DataStudio sudah diaktifkan secara default untuk Anda, lihat Coba versi baru DataStudio.

Untuk informasi lebih lanjut tentang cara membuat ruang kerja, lihat Buat ruang kerja.

2. Buat kelompok sumber daya Serverless

Tutorial ini mengharuskan Anda menyinkronkan data dari OSS dan MySQL ke MaxCompute. Tugas sinkronisasi dijalankan pada kelompok sumber daya Serverless DataWorks. Oleh karena itu, Anda harus membeli kelompok sumber daya Serverless dan menyelesaikan persiapan yang diperlukan.

  1. Beli kelompok sumber daya Serverless.

    Tutorial ini memerlukan kelompok sumber daya Serverless DataWorks untuk sinkronisasi data dan penjadwalan. Anda harus membeli kelompok sumber daya Serverless dan menyelesaikan persiapan yang diperlukan.

    1. Login ke halaman DataWorks - Resource Groups. Di bilah navigasi atas, ubah wilayah ke China (Shanghai). Di panel navigasi sebelah kiri, klik Resource Group untuk membuka halaman Resource Groups.

    2. Klik Create Resource Group. Di halaman pembelian kelompok sumber daya, atur Region and Zone menjadi China (Shanghai) dan tentukan Resource Group Name. Konfigurasikan parameter lainnya dan selesaikan pembayaran sesuai petunjuk. Untuk informasi lebih lanjut tentang penagihan kelompok sumber daya Serverless, lihat Penagihan kelompok sumber daya Serverless.

      Catatan

      Jika tidak tersedia virtual private cloud (VPC) atau vSwitch di wilayah saat ini, Anda dapat mengklik tautan konsol dalam deskripsi parameter untuk membuatnya. Untuk informasi lebih lanjut tentang VPC dan vSwitch, lihat Apa itu VPC?.

  2. Hubungkan kelompok sumber daya ke ruang kerja DataWorks.

    Kelompok sumber daya Serverless yang baru dibeli harus disambungkan ke ruang kerja sebelum dapat digunakan.

    Login ke halaman DataWorks - Resource Groups. Di bilah navigasi atas, ubah wilayah ke China (Shanghai). Temukan kelompok sumber daya Serverless yang telah Anda beli. Di kolom Actions, klik Associate Workspace. Lalu, klik Associate di sebelah ruang kerja DataWorks yang telah Anda buat.

  3. Konfigurasikan akses Internet untuk kelompok sumber daya.

    Data uji untuk tutorial ini diambil dari Internet. Secara default, kelompok sumber daya tidak dapat mengakses Internet. Anda harus mengonfigurasi Gateway NAT Internet untuk VPC yang disambungkan ke kelompok sumber daya dan menambahkan elastic IP addresses (EIPs). Hal ini menghubungkan VPC ke Internet sehingga dapat mengambil data tersebut.

    1. Login ke Konsol VPC - Internet NAT Gateway. Di bilah menu atas, pilih wilayah China (Shanghai).

    2. Klik Create Internet NAT Gateway dan konfigurasikan parameter-parameter tersebut. Tabel berikut menjelaskan parameter utama untuk tutorial ini. Untuk semua parameter lainnya, gunakan nilai default.

      Parameter

      Nilai

      Region

      Tiongkok (Shanghai).

      Network and Zone

      Pilih VPC dan vSwitch yang disambungkan ke kelompok sumber daya.

      Anda dapat membuka Konsol DataWorks, mengubah wilayah, lalu mengklik Resource Group di panel navigasi sebelah kiri. Temukan kelompok sumber daya yang telah Anda buat dan klik Network Settings di kolom Actions. Di bagian Data Scheduling & Data Integration, lihat VPC dan vSwitch yang terkait. Untuk informasi lebih lanjut tentang VPC dan vSwitch, lihat Apa itu VPC?.

      Network Type

      Internet NAT Gateway.

      EIP

      Beli EIP Baru.

      Create Service-linked Role

      Saat pertama kali membuat Gateway NAT, Anda harus membuat peran terkait layanan. Klik Create Service-linked Role.

    3. Klik Buy Now, terima ketentuan layanan, lalu klik Activate Now untuk menyelesaikan pembelian.

Untuk informasi lebih lanjut tentang cara menambahkan dan menggunakan kelompok sumber daya Serverless, lihat Gunakan kelompok sumber daya Serverless.

3. Hubungkan proyek MaxCompute

Anda harus menyambungkan proyek MaxCompute yang telah Anda buat ke ruang kerja DataWorks sebagai sumber daya komputasi. Hal ini memungkinkan Anda memproses data di MaxCompute menggunakan modul Pengembangan Data.

  1. Buka halaman DataWorks - Workspaces. Di bilah navigasi atas, ubah wilayah ke China (Shanghai). Temukan ruang kerja Anda dan klik namanya untuk membuka halaman Workspace Details.

  2. Di panel navigasi sebelah kiri, klik Computing Resource. Anda akan diarahkan ke halaman DataStudio > Computing Resource (image).

  3. Klik Create Computing Resource. Pilih Jenis sumber daya komputasi dan konfigurasikan parameter untuk menyambungkan sumber daya tersebut.

    Tutorial ini menggunakan MaxCompute sebagai sumber daya komputasi dan penyimpanan. Tabel berikut menjelaskan parameter utama lainnya. Untuk semua parameter lainnya, gunakan nilai default.

    Parameter

    Deskripsi

    Data Source Name

    Nama kustom. Nama ini mengidentifikasi sumber daya komputasi. Saat waktu proses, nama instans sumber daya komputasi digunakan untuk memilih sumber daya komputasi bagi tugas tersebut.

    Alibaba Cloud Account

    Pilih Current Alibaba Cloud Account.

    Region

    Pilih wilayah yang sama dengan ruang kerja DataWorks saat ini: China (Shanghai).

    MaxCompute Project Name

    Pilih proyek MaxCompute yang akan disambungkan. Untuk tutorial ini, sambungkan proyek MaxCompute yang sesuai yang dibuat di Langkah 2 ke lingkungan produksi dan pengembangan.

    Default Access Identity

    Menentukan identitas yang digunakan untuk mengakses proyek MaxCompute di ruang kerja saat ini.

    • Lingkungan pengembangan: Hanya identitas Executor yang didukung.

    • Lingkungan produksi: Pilih identitas dari daftar tarik-turun berdasarkan akun login saat ini. Untuk tutorial ini, pilih Alibaba Cloud Account.

      Catatan

      Jika Anda login dengan identitas berbeda, lihat Versi baru DataStudio: Menyambungkan mesin komputasi MaxCompute untuk detail konfigurasi.

    Connection Configuration

    Kelompok sumber daya yang digunakan untuk menghubungkan ke sumber daya komputasi MaxCompute. Kelompok sumber daya Serverless yang telah Anda buat dan sambungkan ke ruang kerja saat ini akan ditampilkan di sini. Anda harus menguji konektivitas untuk lingkungan pengembangan maupun produksi.

  4. Klik Create and Associate Computing Resource with DataStudio.

    Ikuti petunjuk di halaman tersebut. Setelah Anda memperbarui halaman sumber daya komputasi untuk Pengembangan Data, sumber daya komputasi MaxCompute yang disambungkan akan ditampilkan.

    Catatan

    Jika status sumber daya komputasi MaxCompute belum terhubung, klik Associate.

Langkah selanjutnya

Sekarang Anda telah menyiapkan lingkungan, Anda dapat melanjutkan ke tutorial berikutnya. Dalam tutorial berikutnya, Anda akan mempelajari cara menyinkronkan informasi pengguna dasar dan log akses situs web ke MaxCompute. Untuk informasi lebih lanjut, lihat Sinkronisasi data.