DataWorks menyediakan node pemantauan kualitas data. Anda dapat mengonfigurasi aturan pemantauan pada node ini untuk memeriksa kualitas data tabel dalam sumber data, seperti mendeteksi data kotor, serta menentukan kebijakan penjadwalan kustom guna menjalankan tugas pemantauan secara berkala. Topik ini menjelaskan cara menggunakan node pemantauan kualitas data.
Informasi latar belakang
Fitur Kualitas Data di DataWorks membantu Anda mendeteksi perubahan pada data sumber dan melacak data kotor yang dihasilkan selama proses ekstrak, transformasi, dan muat (ETL). Fitur ini secara otomatis memblokir tugas yang bermasalah untuk mencegah penyebaran data kotor ke node hilir, sehingga menghindari pembuatan data tak terduga yang dapat memengaruhi operasi normal dan keputusan bisnis. Selain itu, fitur ini secara signifikan mengurangi waktu pemecahan masalah dan mencegah pemborosan sumber daya akibat pengulangan eksekusi tugas. Untuk informasi selengkapnya, lihat Kualitas Data.
Batasan
Jenis sumber data yang didukung: MaxCompute, E-MapReduce, Hologres, CDH Hive, AnalyticDB for PostgreSQL, AnalyticDB for MySQL, dan StarRocks.
Cakupan tabel yang didukung:
Anda hanya dapat memantau tabel dalam sumber data yang ditautkan ke ruang kerja yang sama dengan node pemantauan kualitas data.
Setiap node hanya dapat memantau satu tabel, tetapi Anda dapat mengonfigurasi beberapa aturan pemantauan untuk node tersebut. Cakupan pemantauan bervariasi berdasarkan jenis tabel:
Tabel non-partisi: Seluruh tabel dipantau secara default.
Tabel partisi: Tentukan ekspresi filter partisi untuk memantau partisi tertentu.
CatatanUntuk memantau beberapa tabel, Anda harus membuat beberapa node pemantauan kualitas data.
Batasan pada operasi yang didukung:
Aturan pemantauan kualitas data yang dibuat di DataStudio hanya dapat dijalankan, dimodifikasi, dipublikasikan, dan dikelola di DataStudio. Anda dapat melihat aturan ini di modul Kualitas Data, tetapi tidak dapat memicu eksekusi terjadwal atau mengelolanya di sana.
Jika Anda memodifikasi aturan pemantauan dalam node pemantauan kualitas data lalu memublikasikan node tersebut, aturan pemantauan asli akan diganti.
Prasyarat
Alur bisnis telah dibuat.
Di Pengembangan Data (DataStudio), operasi pengembangan untuk sumber data berbeda dilakukan berdasarkan alur bisnis. Oleh karena itu, Anda harus membuat alur bisnis sebelum membuat node. Untuk informasi selengkapnya, lihat Buat alur bisnis.
Sumber data telah dibuat dan ditautkan ke ruang kerja saat ini, serta tabel yang akan dipantau telah dibuat dalam sumber data tersebut.
Sebelum menjalankan tugas pemantauan kualitas data, Anda harus membuat tabel yang akan dipantau oleh node pemantauan dalam sumber data tersebut. Untuk informasi selengkapnya, lihat Manajemen Sumber Data, Manajemen Sumber Daya, dan Pengembangan node.
Kelompok sumber daya telah dibuat.
Node pemantauan kualitas data hanya dapat dijalankan pada kelompok sumber daya Serverless. Untuk informasi selengkapnya, lihat Manajemen Sumber Daya.
(Opsional, untuk pengguna RAM) Pengguna Resource Access Management (RAM) untuk pengembangan tugas telah ditambahkan ke ruang kerja dan diberikan peran Developer atau Workspace Administrator. Peran Workspace Administrator memiliki izin yang luas dan harus diberikan dengan hati-hati. Untuk informasi selengkapnya tentang penambahan anggota dan pemberian izin, lihat Tambahkan anggota ruang kerja.
Langkah 1: Buat node pemantauan kualitas data
Buka halaman DataStudio.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih . Di halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.
Klik kanan alur bisnis target dan pilih .
Di kotak dialog Create Node, masukkan Name untuk node tersebut dan klik Confirm. Setelah node dibuat, Anda dapat mengembangkan dan mengonfigurasi tugas di halaman konfigurasi node.
Langkah 2: Konfigurasikan aturan pemantauan kualitas data
1. Pilih tabel yang akan dipantau
2. Konfigurasikan cakupan data untuk pemantauan
3. Konfigurasikan aturan pemantauan kualitas data
4. Konfigurasikan sumber daya komputasi
Langkah 3: Konfigurasikan kebijakan penanganan hasil pemeriksaan
Di bagian Quality Monitoring And Handling pada halaman konfigurasi node, Anda dapat mengonfigurasi kebijakan penanganan hasil pemeriksaan abnormal dan metode berlangganan notifikasinya.
Kategori pengecualian
Kebijakan penanganan pengecualian
Metode berlangganan pengecualian
Langkah 4: Konfigurasikan penjadwalan tugas
Untuk menjalankan tugas node yang dibuat secara berkala, klik Scheduling di panel kanan halaman konfigurasi node dan konfigurasikan properti penjadwalan untuk tugas node sesuai kebutuhan. Untuk informasi selengkapnya, lihat Konfigurasikan properti penjadwalan untuk node.
Anda harus mengatur properti Rerun dan Parent Nodes untuk node sebelum dapat mengirimkannya.
Langkah 5: Debug tugas
Lakukan operasi debugging berikut sesuai kebutuhan untuk memeriksa apakah tugas berjalan sesuai harapan.
(Opsional) Pilih kelompok sumber daya dan tetapkan nilai untuk parameter kustom.
Klik ikon
di bilah alat. Di kotak dialog Parameters, pilih kelompok sumber daya penjadwalan yang akan digunakan untuk debugging.Jika tugas Anda menggunakan parameter penjadwalan, Anda dapat menetapkan nilai untuk variabel di sini untuk debugging. Untuk informasi selengkapnya tentang logika penetapan parameter, lihat Proses debugging tugas.
Gambar berikut menunjukkan contoh konfigurasi parameter penjadwalan.

Simpan dan jalankan tugas.
Klik ikon
di bilah alat untuk menyimpan tugas. Klik ikon
untuk menjalankan tugas.Setelah tugas selesai, Anda dapat melihat hasil eksekusi di bagian bawah halaman konfigurasi node. Jika eksekusi gagal, pecahkan masalah berdasarkan pesan kesalahan.
(Opsional) Lakukan pengujian asap.
Jika Anda ingin melakukan pengujian asap di lingkungan pengembangan untuk memeriksa apakah tugas node penjadwalan berjalan sesuai harapan, Anda dapat melakukan pengujian asap saat mengirimkan node atau setelah node dikirimkan. Untuk informasi selengkapnya, lihat Lakukan pengujian asap.
Langkah 6: Kirim dan publikasikan tugas
Setelah tugas node dikonfigurasi, kirim dan publikasikan. Setelah node dipublikasikan, tugas tersebut akan berjalan secara berkala berdasarkan konfigurasi penjadwalannya.
Saat Anda mengirim dan mempublikasikan node, aturan kualitas yang dikonfigurasi untuk node tersebut juga dikirim dan dipublikasikan.
Klik ikon
di bilah alat untuk menyimpan node.Klik ikon
di bilah alat untuk mengirimkan tugas node.Saat mengirimkan tugas, masukkan Change Description di kotak dialog Submit. Jika diperlukan, Anda juga dapat memilih apakah akan melakukan tinjauan kode setelah node dikirimkan.
CatatanAnda harus mengatur properti Rerun dan Parent Nodes untuk node sebelum dapat mengirimkannya.
Tinjauan kode membantu mengontrol kualitas konfigurasi tugas dan mencegah kesalahan yang dapat terjadi jika konfigurasi salah dipublikasikan tanpa ditinjau. Jika Anda melakukan tinjauan kode, node yang dikirimkan hanya dapat dipublikasikan setelah disetujui oleh peninjau. Untuk informasi selengkapnya, lihat Tinjauan kode.
Jika Anda menggunakan ruang kerja dalam mode standar, setelah tugas berhasil dikirimkan, klik Publish di pojok kanan atas halaman konfigurasi node untuk mempublikasikan tugas ke lingkungan produksi. Untuk informasi selengkapnya, lihat Publikasikan tugas.
Langkah selanjutnya
O&M Tugas: Setelah tugas dikirim dan dipublikasikan, tugas tersebut berjalan secara berkala berdasarkan konfigurasi node. Anda dapat mengklik O&M di pojok kanan atas halaman konfigurasi node untuk membuka Pusat Operasi dan melihat status penjadwalan dan eksekusi tugas yang dipicu otomatis, termasuk status node dan detail aturan yang dipicu. Untuk informasi selengkapnya, lihat Kelola tugas yang dipicu otomatis.
Kualitas Data: Setelah aturan pemantauan kualitas data dipublikasikan, Anda juga dapat membuka modul Kualitas Data untuk melihat detail aturan. Namun, Anda tidak dapat melakukan operasi manajemen, seperti memodifikasi atau menghapus aturan tersebut. Untuk informasi selengkapnya, lihat Kualitas Data.





