DataWorks memungkinkan Anda membuat node Data Lake Analytics untuk membangun proses ekstraksi, transformasi, dan pemuatan (ETL) daring.
Informasi latar belakang
Node Data Lake Analytics digunakan untuk terhubung ke Alibaba Cloud Data Lake Analytics (DLA). Untuk informasi lebih lanjut tentang DLA, lihat Apa itu DLA?.
Tugas pada node Data Lake Analytics dapat dijalankan pada grup sumber daya tanpa server atau grup sumber daya eksklusif versi lama untuk penjadwalan. Kami menyarankan Anda menjalankan tugas pada grup sumber daya tanpa server. Untuk informasi lebih lanjut tentang cara membeli dan menggunakan grup sumber daya tanpa server, lihat Buat dan Gunakan Grup Sumber Daya Tanpa Server.
Batasan
Node Data Lake Analytics didukung di wilayah berikut: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Shenzhen), Tiongkok (Hong Kong), Jepang (Tokyo), Singapura, Jerman (Frankfurt), Inggris (London), AS (Silicon Valley), dan AS (Virginia).
Prosedur
Buka halaman DataStudio.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.
Di halaman DataStudio, arahkan pointer ke ikon
dan pilih .Sebagai alternatif, Anda dapat menemukan alur kerja yang diinginkan, klik nama alur kerja, klik kanan UserDefined, dan pilih .
- Dalam kotak dialog Create Node, konfigurasikan parameter Name dan Path.Catatan Nama node harus memiliki panjang 1 hingga 128 karakter dan dapat berisi huruf, angka, garis bawah (_), dan titik (.).
- Klik Confirm.
Konfigurasikan node Data Lake Analytics.
Pilih sumber data.
Pilih sumber data untuk node tersebut. Jika Anda tidak dapat menemukan sumber data yang ingin digunakan dari daftar drop-down, klik Add Data Source di sebelah kanan Pilih Sumber Data dan tambahkan sumber data di halaman Data Sources. Untuk informasi lebih lanjut, lihat Tambahkan Sumber Data DLA.
Tulis pernyataan SQL untuk node tersebut.
Setelah memilih sumber data, tulis pernyataan SQL berdasarkan sintaks yang didukung oleh DLA. Anda dapat menulis pernyataan bahasa manipulasi data (DML) atau bahasa definisi data (DDL).
Klik ikon
di bilah alat atas.Klik ikon
di bilah alat atas untuk mengeksekusi pernyataan SQL.
Jika Anda ingin menggunakan grup sumber daya lain untuk menguji node Data Lake Analytics di halaman DataStudio, klik ikon
di bilah alat atas dan pilih grup sumber daya tanpa server yang ingin digunakan.CatatanGrup sumber daya tanpa server diperlukan untuk mengakses sumber data yang diterapkan dalam virtual private cloud (VPC). Dalam hal ini, Anda harus memilih grup sumber daya tanpa server yang terhubung ke sumber data.
Di tab konfigurasi node, klik Properties di panel navigasi sisi kanan. Di tab Properti, konfigurasikan properti penjadwalan untuk node tersebut. Untuk informasi lebih lanjut, lihat Konfigurasikan Properti Dasar.
Anda harus memilih grup sumber daya tanpa server yang terhubung ke node Data Lake Analytics untuk menjadwalkan tugas secara berkala pada node Data Lake Analytics.
Klik ikon
di bilah alat atas untuk menyimpan node.Klik ikon
di bilah alat atas.Dalam kotak dialog Submit, konfigurasikan parameter Change description.
Klik Confirm.
- Lakukan operasi O&M pada node. Untuk informasi lebih lanjut, lihat Lakukan Operasi O&M Dasar pada Node yang Dipicu Otomatis.
Simpan dan komit node.
Anda harus mengonfigurasi parameter Rerun dan Parent Nodes di tab Properti sebelum mengomitm node.
Jika ruang kerja yang Anda gunakan berada dalam mode standar, Anda harus mengklik Deploy di pojok kanan atas tab konfigurasi untuk menerapkan node setelah mengomitmnya. Untuk informasi lebih lanjut, lihat Terapkan Node.