Di DataWorks, node CDH Presto merupakan mesin kueri SQL terdistribusi yang digunakan untuk analitik data real-time pada kluster CDH Anda. Topik ini menjelaskan cara mengonfigurasi dan menggunakan node CDH Presto.
Prasyarat
Anda telah membuat kluster Alibaba Cloud CDH dan mengaitkannya ke ruang kerja DataWorks. Untuk informasi selengkapnya, lihat Data Studio: Mengaitkan resource komputasi CDH.
PentingPastikan komponen Presto telah diinstal pada kluster CDH Anda dan pengaturannya telah dikonfigurasi saat Anda mengaitkan kluster tersebut.
(Opsional) Jika Anda menggunakan pengguna RAM, tambahkan pengguna tersebut ke ruang kerja dan berikan peran Developer atau Workspace Administrator. Peran Workspace Administrator memiliki izin yang luas dan harus diberikan dengan hati-hati. Untuk informasi selengkapnya tentang cara menambahkan anggota ke ruang kerja, lihat Menambahkan anggota ke ruang kerja.
CatatanJika Anda menggunakan akun root, langkah ini dapat dilewati.
Anda telah mengonfigurasi sumber data Hive di DataWorks dan lulus uji konektivitas. Untuk informasi selengkapnya, lihat Manajemen Sumber Data.
Create a node
Untuk petunjuknya, lihat Create a node.
Node development
Kembangkan kode task Anda di editor SQL. Anda dapat mendefinisikan variabel dalam kode menggunakan format ${variable_name} dan memberikan nilai variabel tersebut di Scheduling configuration > Scheduling parameters di sisi kanan editor node. Hal ini memungkinkan Anda untuk secara dinamis pass parameter pada eksekusi terjadwal. Untuk informasi lebih lanjut tentang scheduling parameters, lihat Sources and expressions of scheduling parameters. Contohnya:
SHOW TABLES;
SELECT * FROM userinfo ;
-- You can use scheduling parameters.
SELECT '${var}'; Debug the node
Di Run Configuration > Compute resource, atur Compute resource dan Resource group.
Untuk Compute resource, pilih kluster CDH yang telah Anda daftarkan.
Untuk Resource group, pilih kelompok sumber daya penjadwalan yang telah lulus uji konektivitas sumber data. Untuk informasi selengkapnya, lihat Network connectivity solutions.
Pada bilah alat editor node, klik Run.
Langkah berikutnya
Node scheduling configuration: Untuk menjalankan node secara berkala, konfigurasikan Time Property dan properti penjadwalan terkait di panel Scheduling configuration di sisi kanan halaman.
Publish a node: Untuk menerbitkan node ke lingkungan produksi, klik ikon
. Hanya node yang diterbitkan ke lingkungan produksi yang akan dijadwalkan.Task O&M: Setelah menerbitkan node, Anda dapat memantau eksekusi terjadwalnya di Operation Center. Untuk informasi selengkapnya, lihat Getting started with Operation Center.