Anda dapat menggunakan node PostgreSQL di DataWorks untuk mengembangkan dan menjadwalkan tugas PostgreSQL berulang serta mengintegrasikannya dengan pekerjaan lain. Topik ini menjelaskan cara mengembangkan tugas tersebut.
Informasi latar belakang
PostgreSQL adalah sistem manajemen database relasional (RDBMS) open-source yang kuat dan fleksibel. PostgreSQL dikenal karena model datanya yang andal, stabilitas, skalabilitas tinggi, serta kumpulan fitur inti yang lengkap. Untuk informasi selengkapnya, lihat PostgreSQL.
Prasyarat
Buat Business Flow.
DataStudio mengorganisasi pengembangan berdasarkan Business Flow. Anda harus membuatnya terlebih dahulu sebelum membuat node. Untuk informasi selengkapnya, lihat Buat workflow.
Sumber data PostgreSQL telah dibuat.
Sebelum Anda dapat mengakses data di database PostgreSQL, Anda harus menambahkan database tersebut ke DataWorks sebagai sumber data PostgreSQL. Untuk informasi selengkapnya, lihat Sumber data PostgreSQL.
CatatanNode PostgreSQL hanya mendukung sumber data PostgreSQL yang dibuat menggunakan string koneksi Java Database Connectivity (JDBC).
(Opsional; wajib untuk pengguna RAM) Tambahkan pengguna RAM ke ruang kerja dan tetapkan peran Develop atau Workspace Administrator. Berikan peran Workspace Administrator dengan hati-hati karena hak istimewanya yang tinggi. Untuk informasi selengkapnya, lihat Tambahkan anggota ke ruang kerja.
Batasan
Wilayah yang didukung: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Shenzhen), Tiongkok (Chengdu), Tiongkok (Hong Kong), Singapura, Malaysia (Kuala Lumpur), Jerman (Frankfurt), AS (Silicon Valley), dan AS (Virginia).
Langkah 1: Buat node PostgreSQL
Buka halaman DataStudio.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.
Klik kanan business flow target dan pilih .
Pada kotak dialog Create Node, masukkan Name untuk node tersebut dan klik OK.
Langkah 2: Kembangkan tugas PostgreSQL
(Opsional) Pilih sumber data PostgreSQL
Jika ruang kerja Anda memiliki beberapa sumber data PostgreSQL, pilih sumber data yang diperlukan di tab konfigurasi node. Jika hanya tersedia satu sumber data PostgreSQL, sumber data tersebut akan digunakan secara default.
Node PostgreSQL hanya mendukung sumber data PostgreSQL yang dibuat menggunakan string koneksi Java Database Connectivity (JDBC).
Kembangkan kode SQL: Contoh sederhana
Anda dapat menulis kode tugas di editor kode untuk node PostgreSQL. Kode contoh berikut melakukan kueri informasi tentang semua tabel dasar di database PostgreSQL:
SELECT * FROM information_schema.tables
WHERE table_type = 'BASE TABLE';Kembangkan kode SQL: Gunakan parameter penjadwalan
DataWorks menyediakan scheduling parameters yang dapat Anda gunakan untuk meneruskan nilai dinamis ke kode dalam pekerjaan berulang. Anda dapat mendefinisikan variabel dalam tugas node menggunakan format ${variable_name}. Kemudian, Anda dapat memberikan nilai variabel tersebut di bagian Scheduling parameter pada tab Schedule di panel navigasi kanan. Untuk informasi selengkapnya tentang format dan konfigurasi parameter penjadwalan yang didukung, lihat Format parameter penjadwalan yang didukung dan Konfigurasi dan penggunaan parameter penjadwalan.
Contoh: Kueri informasi tentang semua tabel dasar di database. Dalam contoh ini, nilai parameter penjadwalan a diatur ke BASE_TABLE.
Kodenya sebagai berikut.
SELECT * FROM information_schema.tables
WHERE table_type = '${a}';Langkah 3: Konfigurasi penjadwalan tugas
Untuk menjadwalkan tugas, klik Scheduling Configuration di sebelah kanan dan konfigurasikan propertinya. Untuk informasi selengkapnya, lihat Ikhtisar.
Konfigurasikan Rerun Property dan Upstream Dependent Node sebelum menyerahkan.
Langkah 4: Debug kode tugas
Debug tugas untuk memastikan eksekusi yang benar:
(Opsional) Pilih kelompok sumber daya debugging dan tetapkan nilai parameter.
Klik ikon
di bilah alat. Di kotak dialog Parameters, pilih kelompok sumber daya.Tetapkan nilai untuk setiap parameter penjadwalan guna debugging. Untuk informasi selengkapnya tentang logika penetapan parameter, lihat Proses debugging tugas.
Simpan dan jalankan kode tugas.
Klik ikon
untuk menyimpan, lalu klik ikon
untuk menjalankan.(Opsional) Jalankan Pengujian asap.
Jalankan Pengujian asap selama atau setelah penyerahan untuk memverifikasi eksekusi di lingkungan pengembangan. Untuk informasi selengkapnya, lihat Lakukan Pengujian asap.
Langkah 5: Serahkan dan publikasikan tugas
Serahkan dan publikasikan node untuk mengaktifkan jadwal.
Klik ikon
di bilah alat untuk menyimpan node.Klik ikon
di bilah alat untuk menyerahkan tugas node.Di kotak dialog Submit, masukkan Change Description dan pilih opsi tinjauan kode.
CatatanKonfigurasikan Rerun Property dan Upstream Dependent Node sebelum menyerahkan.
Tinjauan kode memastikan kualitas. Jika diaktifkan, peninjau harus menyetujui kode sebelum dipublikasikan. Untuk informasi selengkapnya, lihat Tinjauan kode.
Di ruang kerja mode standar, klik Publish di pojok kanan atas untuk men-deploy ke produksi. Untuk informasi selengkapnya, lihat Publikasikan tugas.
Langkah selanjutnya
Setelah tugas diserahkan dan dipublikasikan, tugas tersebut akan dijalankan secara berkala berdasarkan konfigurasi node. Anda dapat mengklik O&M di pojok kanan atas tab konfigurasi node untuk membuka Pusat Operasi. Di Pusat Operasi, Anda dapat melihat status penjadwalan dan eksekusi tugas berulang tersebut. Untuk informasi selengkapnya, lihat Kelola tugas berulang.