全部产品
Search
文档中心

DataWorks:Node CDH Presto

更新时间:Nov 19, 2025

Anda dapat menggunakan node CDH Presto di DataWorks untuk analisis data real-time. Node ini menyediakan mesin kueri SQL terdistribusi guna meningkatkan kemampuan analisis data pada lingkungan CDH Anda. Topik ini menjelaskan cara mengonfigurasi dan menggunakan node CDH Presto.

Prasyarat

  • Kluster Alibaba Cloud CDH telah dibuat dan disambungkan ke ruang kerja DataWorks. Untuk informasi selengkapnya, lihat Pengembangan Data (Baru): Menyambungkan sumber daya komputasi CDH.

    Penting

    Komponen Presto telah diinstal di kluster CDH, dan informasi terkait Presto telah dikonfigurasi saat Anda menyambungkan kluster tersebut.

  • (Opsional) Jika Anda menggunakan Pengguna RAM, pengguna tersebut harus ditambahkan ke ruang kerja yang sesuai untuk pengembangan tugas dan diberikan peran Developer atau Workspace Administrator. Peran Workspace Administrator memiliki izin yang luas dan harus diberikan dengan hati-hati. Untuk informasi selengkapnya tentang penambahan anggota, lihat Menambahkan anggota ke ruang kerja.

    Catatan

    Jika Anda menggunakan Akun Alibaba Cloud, Anda dapat melewati langkah ini.

  • Sumber data Hive telah dikonfigurasi di DataWorks dan lulus uji konektivitas. Untuk informasi selengkapnya, lihat Manajemen Sumber Data.

Create a node

Untuk informasi selengkapnya, lihat Membuat node.

Develop the node

Di editor SQL, Anda dapat menulis kode untuk tugas tersebut. Anda dapat mendefinisikan variabel dalam kode menggunakan format ${variable_name}, lalu menetapkan nilainya di bagian Scheduling Parameters pada tab Schedule di sisi kanan halaman konfigurasi node. Pendekatan ini memungkinkan Anda meneruskan parameter secara dinamis dalam skenario penjadwalan. Untuk informasi selengkapnya tentang penggunaan parameter penjadwalan, lihat Format parameter penjadwalan yang didukung. Berikut contoh kodenya.

SHOW TABLES;

SELECT * FROM userinfo ;
-- You can use scheduling parameters.
SELECT '${var}'; 

Test the node

  1. Pada tab Test, atur parameter Computing Resource dan Resource Group di bagian Computing Resource.

    1. Untuk Computing Resource, pilih nama kluster CDH yang telah Anda daftarkan di DataWorks.

    2. Untuk Resource Group, pilih kelompok sumber daya untuk penjadwalan yang telah lulus uji konektivitas jaringan. Untuk informasi selengkapnya, lihat Solusi konektivitas jaringan.

  2. Di bilah alat di bagian atas halaman konfigurasi node, klik Run.

Langkah Selanjutnya

  • Menjadwalkan node: Jika suatu node dalam folder proyek perlu dijalankan secara berkala, Anda dapat mengatur Scheduling Policy dan mengonfigurasi properti penjadwalan di bagian Scheduling Settings di sisi kanan halaman node.

  • Menerbitkan node: Jika tugas tersebut perlu dijalankan di lingkungan produksi, klik ikon image untuk menerbitkan tugas tersebut. Node dalam folder proyek hanya akan dijalankan sesuai jadwal setelah diterbitkan ke lingkungan produksi.

  • Task O&M: Setelah Anda menerbitkan tugas tersebut, Anda dapat melihat status tugas yang dipicu otomatis di Pusat Operasi. Untuk informasi selengkapnya, lihat Memulai Pusat Operasi.