Anda dapat menggunakan node CDH Presto di DataWorks untuk analisis data real-time. Node ini menyediakan mesin kueri SQL terdistribusi guna meningkatkan kemampuan analisis data pada lingkungan CDH Anda. Topik ini menjelaskan cara mengonfigurasi dan menggunakan node CDH Presto.
Prasyarat
Kluster Alibaba Cloud CDH telah dibuat dan disambungkan ke ruang kerja DataWorks. Untuk informasi selengkapnya, lihat Pengembangan Data (Baru): Menyambungkan sumber daya komputasi CDH.
PentingKomponen Presto telah diinstal di kluster CDH, dan informasi terkait Presto telah dikonfigurasi saat Anda menyambungkan kluster tersebut.
(Opsional) Jika Anda menggunakan Pengguna RAM, pengguna tersebut harus ditambahkan ke ruang kerja yang sesuai untuk pengembangan tugas dan diberikan peran Developer atau Workspace Administrator. Peran Workspace Administrator memiliki izin yang luas dan harus diberikan dengan hati-hati. Untuk informasi selengkapnya tentang penambahan anggota, lihat Menambahkan anggota ke ruang kerja.
CatatanJika Anda menggunakan Akun Alibaba Cloud, Anda dapat melewati langkah ini.
Sumber data Hive telah dikonfigurasi di DataWorks dan lulus uji konektivitas. Untuk informasi selengkapnya, lihat Manajemen Sumber Data.
Create a node
Untuk informasi selengkapnya, lihat Membuat node.
Develop the node
Di editor SQL, Anda dapat menulis kode untuk tugas tersebut. Anda dapat mendefinisikan variabel dalam kode menggunakan format ${variable_name}, lalu menetapkan nilainya di bagian Scheduling Parameters pada tab Schedule di sisi kanan halaman konfigurasi node. Pendekatan ini memungkinkan Anda meneruskan parameter secara dinamis dalam skenario penjadwalan. Untuk informasi selengkapnya tentang penggunaan parameter penjadwalan, lihat Format parameter penjadwalan yang didukung. Berikut contoh kodenya.
SHOW TABLES;
SELECT * FROM userinfo ;
-- You can use scheduling parameters.
SELECT '${var}'; Test the node
Pada tab Test, atur parameter Computing Resource dan Resource Group di bagian Computing Resource.
Untuk Computing Resource, pilih nama kluster CDH yang telah Anda daftarkan di DataWorks.
Untuk Resource Group, pilih kelompok sumber daya untuk penjadwalan yang telah lulus uji konektivitas jaringan. Untuk informasi selengkapnya, lihat Solusi konektivitas jaringan.
Di bilah alat di bagian atas halaman konfigurasi node, klik Run.
Langkah Selanjutnya
Menjadwalkan node: Jika suatu node dalam folder proyek perlu dijalankan secara berkala, Anda dapat mengatur Scheduling Policy dan mengonfigurasi properti penjadwalan di bagian Scheduling Settings di sisi kanan halaman node.
Menerbitkan node: Jika tugas tersebut perlu dijalankan di lingkungan produksi, klik ikon
untuk menerbitkan tugas tersebut. Node dalam folder proyek hanya akan dijalankan sesuai jadwal setelah diterbitkan ke lingkungan produksi.Task O&M: Setelah Anda menerbitkan tugas tersebut, Anda dapat melihat status tugas yang dipicu otomatis di Pusat Operasi. Untuk informasi selengkapnya, lihat Memulai Pusat Operasi.