Anda dapat membuat node Data Lake Analytics di DataWorks untuk membangun alur pemrosesan data extract, transform, and load (ETL) secara online.
Informasi latar belakang
Node Data Lake Analytics digunakan untuk menjalankan task di Data Lake Analytics, sebuah Produk Alibaba Cloud. Untuk informasi selengkapnya, lihat Apa itu Data Lake Analytics?.
Node Data Lake Analytics dapat menjalankan task pada kelompok sumber daya Serverless (direkomendasikan) atau kelompok sumber daya eksklusif generasi sebelumnya untuk penjadwalan. Untuk membeli dan menggunakan kelompok sumber daya Serverless, lihat Menggunakan kelompok sumber daya Serverless.
Batasan
Wilayah yang didukung: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Shenzhen), Tiongkok (Hong Kong), Jepang (Tokyo), Singapura, Jerman (Frankfurt), Inggris (London), AS (Silicon Valley), dan AS (Virginia).
Prosedur
Buka halaman Data Studio.
Masuk ke Konsol DataWorks. Pada bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down, lalu klik Go to Data Development.
Arahkan kursor ke ikon
dan klik .Atau, buka business flow target, klik kanan Custom, lalu pilih .
- Pada kotak dialog Create Node, konfigurasikan parameter Name dan Path. Catatan Nama node harus terdiri dari 1 hingga 128 karakter dan hanya boleh berisi huruf, angka, garis bawah (_), serta titik (.).
- Klik Confirm.
Edit node Data Lake Analytics.
Pilih sumber data.
Pilih sumber data tujuan untuk task tersebut. Jika sumber data yang Anda butuhkan tidak tersedia dalam daftar drop-down, klik New Data Source di sebelah kanan untuk membuatnya pada halaman Data Source Management. Untuk informasi selengkapnya, lihat Mengonfigurasi sumber data Data Lake Analytics (DLA).
Edit pernyataan SQL.
Setelah memilih sumber data, tulis pernyataan SQL yang mengikuti sintaks Data Lake Analytics. Anda dapat menjalankan pernyataan DML maupun DDL.
Klik ikon
pada bilah alat untuk menyimpan perubahan Anda. Klik ikon
pada bilah alat untuk menjalankan pernyataan SQL.
Untuk mengubah resource yang digunakan saat mengeksekusi task selama pengujian di halaman Data Development, klik ikon
pada bilah alat dan pilih kelompok sumber daya Serverless target. CatatanKarena kelompok sumber daya Serverless diperlukan untuk menjalankan task yang mengakses sumber data di virtual private cloud (VPC), Anda harus memilih kelompok sumber daya Serverless yang telah lulus uji konektivitas.
Klik Schedule di sisi kanan area pengeditan node untuk mengonfigurasi properti penjadwalan node tersebut. Untuk informasi selengkapnya, lihat Mengonfigurasi properti dasar.
Saat mengonfigurasi properti resource, atur kelompok sumber daya penjadwalan ke kelompok sumber daya Serverless yang terhubung ke jaringan Data Lake Analytics. Kelompok sumber daya ini digunakan untuk penjadwalan berulang.
Klik ikon
pada bilah alat untuk menyimpan node.Klik ikon
pada bilah alat.Pada kotak dialog Commit New Version, masukkan Change description.
Klik Confirm.
- Lakukan operasi O&M pada node tersebut. Untuk informasi selengkapnya, lihat Melakukan operasi O&M dasar pada node auto triggered.
Simpan dan komit node tersebut.
Anda harus mengonfigurasi properti Rerun dan dependensi ancestor node sebelum dapat mengomitmennya.
Jika Anda menggunakan ruang kerja dalam mode standar, klik Publish di pojok kanan atas setelah node dikomit. Untuk informasi selengkapnya, lihat Menerbitkan task.