全部产品
Search
文档中心

DataWorks:Konfigurasikan node StarRocks

更新时间:Jul 06, 2025

DataWorks menyediakan node StarRocks yang memungkinkan Anda mengembangkan dan menjadwalkan tugas StarRocks secara berkala serta mengintegrasikannya dengan jenis tugas lainnya. Topik ini menjelaskan cara menggunakan node StarRocks untuk mengembangkan tugas.

Informasi latar belakang

StarRocks adalah mesin analitik data kecepatan tinggi generasi berikutnya yang dibangun berdasarkan kerangka kerja Massively Parallel Processing (MPP) dan cocok untuk semua skenario analitik data. StarRocks kompatibel dengan protokol MySQL. StarRocks memberikan performa yang sangat baik dan mendukung berbagai model data dalam skenario online analytical processing (OLAP), termasuk analisis multidimensi, analisis danau data, kueri konkurensi tinggi, dan analisis data real-time.

Prasyarat

  • Sebuah alur kerja telah dibuat.

    Operasi pengembangan di berbagai jenis mesin komputasi dilakukan berdasarkan alur kerja di DataStudio. Oleh karena itu, sebelum membuat node, Anda harus membuat alur kerja terlebih dahulu. Untuk informasi lebih lanjut, lihat Buat Alur Kerja.

  • Sumber data StarRocks telah ditambahkan.

    Anda harus menambahkan database StarRocks ke DataWorks sebagai sumber data StarRocks. Untuk informasi lebih lanjut, lihat Sumber Data StarRocks.

    Catatan

    Anda hanya dapat membuat node StarRocks berdasarkan sumber data StarRocks yang ditambahkan ke DataWorks dalam mode string koneksi Java Database Connectivity (JDBC).

  • (Diperlukan jika Anda menggunakan pengguna RAM untuk mengembangkan tugas) Pengguna RAM telah ditambahkan ke ruang kerja DataWorks sebagai anggota dan diberi peran Develop atau Workspace Administrator. Peran Workspace Administrator memiliki lebih banyak izin daripada yang diperlukan. Berhati-hatilah saat memberikan peran tersebut. Untuk informasi lebih lanjut tentang cara menambahkan anggota dan menetapkan peran kepada anggota, lihat Tambahkan Anggota Ruang Kerja dan Tetapkan Peran Kepada Mereka.

Batasan

Jenis node ini didukung di wilayah berikut: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Shenzhen), Tiongkok (Chengdu), Tiongkok (Hong Kong), Singapura, Malaysia (Kuala Lumpur), Jerman (Frankfurt), AS (Silicon Valley), dan AS (Virginia).

Langkah 1: Buat sebuah node StarRocks

  1. Pergi ke halaman DataStudio.

    Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi di sebelah kiri, pilih Data Development and O&M > Data Development. Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.

  2. Temukan alur kerja yang diinginkan, klik kanan nama alur kerja, dan pilih Create Node > Database > StarRocks.

  3. Di kotak dialog Create Node, konfigurasikan parameter Name dan klik Confirm. Kemudian, Anda dapat menggunakan node tersebut untuk mengembangkan tugas dan mengonfigurasi properti penjadwalan tugas.

Langkah 2: Kembangkan tugas StarRocks

(Opsional) Pilih sumber data StarRocks

Jika Anda telah menambahkan beberapa sumber data StarRocks ke ruang kerja yang diinginkan, Anda harus memilih sumber data pada tab konfigurasi node StarRocks sebelum dapat menggunakan node tersebut untuk mengembangkan tugas. Jika Anda hanya menambahkan satu sumber data StarRocks ke ruang kerja yang diinginkan, sumber data tersebut digunakan secara default untuk mengembangkan tugas.

Catatan

Anda hanya dapat membuat node StarRocks berdasarkan sumber data StarRocks yang ditambahkan ke DataWorks dalam mode string koneksi Java Database Connectivity (JDBC).

image

Kembangkan kode SQL: Contoh sederhana

Di editor kode pada tab konfigurasi node StarRocks, tulis kode tugas. Contoh kode berikut menunjukkan cara menanyakan informasi tentang semua tabel yang tipenya adalah BASE TABLE dalam database StarRocks:

SELECT * FROM information_schema.tables
WHERE table_type = 'BASE TABLE';

Kembangkan Kode SQL: Ganti katalog dan database

SET CATALOG catalog_name; -- Ganti katalog aktif untuk sesi saat ini  
USE catalog_name.db_name; -- Tentukan database aktif untuk sesi saat ini
Catatan

Jika nama katalog atau database adalah kata kunci, tutup dengan backticks (``) untuk menghindari kesalahan parsing.

Kembangkan kode SQL: Gunakan parameter penjadwalan

DataWorks menyediakan parameter penjadwalan yang nilainya diganti secara dinamis dalam kode tugas berdasarkan konfigurasi parameter penjadwalan dalam skenario penjadwalan periodik. Anda dapat mendefinisikan variabel dalam kode tugas dalam format ${Variable} dan memberikan nilai ke variabel di bagian Parameters tab Properties. Untuk informasi tentang format yang didukung dari parameter penjadwalan dan cara mengonfigurasi parameter penjadwalan, lihat Format yang Didukung dari Parameter Penjadwalan dan Konfigurasikan dan Gunakan Parameter Penjadwalan.

Dalam contoh kode berikut, nilai parameter penjadwalan a adalah $[yyyymmdd], yang menunjukkan hari saat ini. Anda dapat menjalankan kode berikut untuk menanyakan informasi tentang tabel yang dibuat di database pada hari saat ini:

SELECT * FROM information_schema.tables
WHERE CREAT_TIME = '${a}';

Langkah 3: Konfigurasikan properti penjadwalan tugas

Jika Anda ingin sistem secara berkala menjalankan tugas pada node, Anda dapat mengklik Properties di panel navigasi di sebelah kanan pada tab konfigurasi node untuk mengonfigurasi properti penjadwalan tugas berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Ikhtisar.

Catatan

Anda harus mengonfigurasi parameter Rerun dan Parent Nodes pada tab Properties sebelum Anda mengirimkan tugas.

Langkah 4: Debug kode tugas

Anda dapat melakukan operasi berikut untuk memeriksa apakah tugas dikonfigurasi sesuai harapan berdasarkan kebutuhan bisnis Anda:

  1. Opsional. Pilih grup sumber daya dan tetapkan parameter kustom ke variabel.

    • Klik ikon 高级运行 di bilah alat atas pada tab konfigurasi node. Dalam kotak dialog Parameters, pilih grup sumber daya untuk penjadwalan yang ingin Anda gunakan untuk debug dan jalankan kode tugas.

    • Jika Anda menggunakan parameter penjadwalan dalam kode tugas Anda, tetapkan parameter penjadwalan ke variabel sebagai nilai dalam kode tugas untuk debugging. Untuk informasi lebih lanjut tentang logika penetapan nilai parameter penjadwalan, lihat Prosedur Debugging.

  2. Simpan dan jalankan kode tugas.

    Di bilah alat atas, klik ikon 保存 untuk menyimpan kode tugas. Lalu, klik ikon 运行 untuk menjalankan kode tugas.

  3. Opsional. Lakukan pengujian asap.

    Saat Anda mengirimkan node atau setelah Anda mengirimkan node, Anda dapat melakukan pengujian asap pada node di lingkungan pengembangan untuk memeriksa apakah node dijalankan sesuai harapan. Untuk informasi lebih lanjut, lihat Lakukan Pengujian Asap.

Langkah 5: Kirim dan deploy tugas

Setelah tugas pada node dikonfigurasi, Anda harus mengirimkan dan mendeploy tugas tersebut. Setelah Anda mengirimkan dan mendeploy tugas, sistem akan menjalankan tugas tersebut secara teratur berdasarkan konfigurasi penjadwalan.

  1. Klik ikon 保存 di bilah alat atas untuk menyimpan tugas.

  2. Klik ikon 提交 di bilah alat atas untuk mengirimkan tugas pada node.

    Di kotak dialog Submit, konfigurasikan parameter Change description. Lalu, tentukan apakah akan meninjau kode tugas setelah Anda mengirimkan tugas berdasarkan kebutuhan bisnis Anda.

    Catatan
    • Anda harus mengonfigurasi parameter Rerun dan Parent Nodes pada tab Properties sebelum Anda mengirimkan tugas.

    • Anda dapat menggunakan fitur tinjauan kode untuk memastikan kualitas kode tugas dan mencegah kesalahan eksekusi tugas yang disebabkan oleh kode tugas yang tidak valid. Jika Anda mengaktifkan fitur tinjauan kode, kode node yang dikirimkan hanya dapat dideploy setelah kode node lolos tinjauan kode. Untuk informasi lebih lanjut, lihat Tinjauan Kode.

Jika Anda menggunakan ruang kerja dalam mode standar, Anda harus mendeploy tugas di lingkungan produksi setelah Anda mengirimkan tugas. Untuk mendeploy tugas pada node, klik Deploy di sudut kanan atas tab konfigurasi node. Untuk informasi lebih lanjut, lihat Deploy Tugas.

Apa yang harus dilakukan selanjutnya

Setelah Anda mengirimkan dan mendeploy tugas, tugas dijalankan secara berkala berdasarkan konfigurasi penjadwalan. Anda dapat mengklik Operation Center di sudut kanan atas tab konfigurasi node yang sesuai untuk pergi ke Operation Center dan melihat status penjadwalan tugas. Untuk informasi lebih lanjut, lihat Lihat dan Kelola Tugas yang Dipicu Otomatis.