All Products
Search
Document Center

DataWorks:Buat node CDH Presto

Last Updated:Jul 06, 2025

Di DataWorks, sebuah node Cloudera's Distribution Including Apache Hadoop (CDH) Presto memungkinkan Anda menggunakan mesin query SQL terdistribusi untuk menganalisis data secara real-time. Ini meningkatkan kemampuan analisis data dalam lingkungan CDH. Topik ini menjelaskan cara membuat dan menggunakan node CDH Presto.

Prasyarat

  • Sebuah workflow dibuat di DataStudio.

    Operasi pengembangan di berbagai jenis mesin komputasi dilakukan berdasarkan workflow di DataStudio. Oleh karena itu, sebelum membuat node, Anda harus membuat workflow. Untuk informasi lebih lanjut, lihat Buat workflow.

  • Sebuah kluster CDH Alibaba Cloud dibuat dan didaftarkan ke DataWorks.

    Sebelum membuat node CDH dan mengembangkan tugas CDH di DataWorks, Anda harus mendaftarkan kluster CDH ke ruang kerja DataWorks. Untuk informasi lebih lanjut, lihat Daftarkan kluster CDH atau CDP ke DataWorks.

  • (Diperlukan jika Anda menggunakan pengguna RAM untuk mengembangkan tugas) Pengguna RAM ditambahkan ke ruang kerja DataWorks sebagai anggota dan diberi peran Development atau Workspace Administrator. Peran Workspace Administrator memiliki lebih banyak izin daripada yang diperlukan. Berhati-hatilah saat memberikan peran Workspace Administrator. Untuk informasi lebih lanjut tentang cara menambahkan anggota, lihat Tambah anggota ruang kerja dan tetapkan peran kepada mereka.

  • Grup sumber daya serverless dibeli dan dikonfigurasi. Konfigurasi tersebut mencakup asosiasi dengan ruang kerja dan konfigurasi jaringan. Untuk informasi lebih lanjut, lihat Buat dan gunakan grup sumber daya serverless.

Batasan

Tugas pada jenis node ini dapat dijalankan pada grup sumber daya serverless atau grup sumber daya eksklusif versi lama untuk penjadwalan. Kami merekomendasikan agar Anda menjalankan tugas pada grup sumber daya serverless.

Langkah 1: Buat node CDH Presto

  1. Pergi ke halaman DataStudio.

    Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih Data Development and O&M > Data Development. Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.

  2. Di halaman DataStudio, temukan workflow yang diinginkan, klik kanan nama workflow, dan pilih Create Node > CDH > CDH Presto.

    Catatan

    Sebagai alternatif, Anda dapat mengarahkan pointer ke ikon Create di bagian atas panel Alur Kerja Terjadwal dan buat node CDH sesuai petunjuk.

  3. Di kotak dialog Create Node, konfigurasikan parameter Name dan klik Confirm. Kemudian, Anda dapat menggunakan node yang telah dibuat untuk mengembangkan dan mengonfigurasi tugas.

Langkah 2: Kembangkan tugas Presto

Anda dapat mengklik dua kali nama node yang telah dibuat untuk pergi ke tab konfigurasi node dan kemudian melakukan operasi berikut untuk mengembangkan tugas.

(Opsional) Pilih instance mesin komputasi CDH

Jika beberapa kluster CDH didaftarkan ke ruang kerja saat ini, Anda harus memilih satu dari daftar drop-down Instance Mesin CDH berdasarkan kebutuhan bisnis Anda. Jika hanya satu kluster CDH yang didaftarkan ke ruang kerja saat ini, Anda tidak perlu memilih kluster CDH.image.png

Contoh pengembangan kode SQL sederhana

Di editor SQL, masukkan kode untuk node. Contoh:

show tables;

select * from userinfo ;

Kembangkan kode SQL: Gunakan parameter penjadwalan

DataWorks menyediakan scheduling parameters yang nilainya diganti secara dinamis dalam kode tugas berdasarkan konfigurasi parameter penjadwalan dalam skenario penjadwalan periodik. Anda dapat mendefinisikan variabel dalam kode tugas dalam format ${Variable} dan memberikan nilai kepada variabel di bagian Scheduling Parameter dari tab Properties. Untuk informasi tentang format yang didukung dari parameter penjadwalan, lihat Format yang didukung dari parameter penjadwalan.

select '${var}'; -- Anda dapat menetapkan parameter penjadwalan tertentu ke variabel var.

Langkah 3: Konfigurasikan properti penjadwalan tugas

Jika Anda ingin sistem secara berkala menjalankan tugas pada node, Anda dapat mengklik Properties di panel navigasi kanan pada tab konfigurasi node untuk mengonfigurasi properti penjadwalan tugas berdasarkan kebutuhan bisnis Anda.

Langkah 4: Debug kode tugas

  1. Opsional. Pilih grup sumber daya dan tetapkan parameter kustom ke variabel.

  2. Simpan dan eksekusi pernyataan SQL.

    Di bilah alat atas, klik ikon 保存 untuk menyimpan pernyataan SQL. Lalu, klik ikon 运行 untuk mengeksekusi pernyataan SQL.

  3. Opsional. Lakukan pengujian asap.

    Anda dapat melakukan pengujian asap pada tugas di lingkungan pengembangan saat Anda mengirimkan tugas atau setelah Anda mengirimkan tugas. Untuk informasi lebih lanjut, lihat Lakukan pengujian asap.

Apa yang harus dilakukan selanjutnya

  1. Kirimkan dan sebarkan tugas.

    1. Klik ikon 保存 di bilah alat atas untuk menyimpan tugas.

    2. Klik ikon 提交 di bilah alat atas untuk mengirimkan tugas.

    3. Di kotak dialog Submit, konfigurasikan parameter Change description.

    4. Klik Confirm.

    Jika Anda menggunakan ruang kerja dalam mode standar, Anda harus menyebarkan tugas di lingkungan produksi setelah Anda mengirimkan tugas. Untuk menyebarkan tugas pada node, klik Deploy di bilah navigasi atas halaman DataStudio. Untuk informasi lebih lanjut, lihat Sebarkan tugas.

  2. Lihat tugas.

    1. Klik Operation Center di sudut kanan atas tab konfigurasi node yang sesuai untuk pergi ke Pusat Operasi di lingkungan produksi.

    2. Lihat tugas terjadwal. Untuk informasi lebih lanjut, lihat Lihat dan kelola tugas pemicu otomatis.

    Untuk melihat lebih banyak informasi tentang tugas, klik Operation Center di bilah navigasi atas halaman DataStudio. Untuk informasi lebih lanjut, lihat Ikhtisar.