全部产品
Search
文档中心

DataWorks:Quality Monitor

更新时间:Feb 05, 2026

Node Pemantauan Kualitas Data di DataWorks memungkinkan Anda memantau kualitas data tabel dari berbagai sumber data dengan mengonfigurasi aturan pemantauan, misalnya untuk mendeteksi Dirty Data. Anda juga dapat menentukan kebijakan penjadwalan kustom guna menjalankan tugas Validasi Data secara berkala. Topik ini menjelaskan cara menggunakan Node Pemantauan Kualitas Data.

Latar Belakang

Fitur Kualitas Data di DataWorks membantu Anda mendeteksi perubahan pada data sumber dan mengidentifikasi Dirty Data yang dihasilkan selama proses ETL (Extract, Transform, and Load). Fitur ini secara otomatis memblokir tugas bermasalah untuk mencegah penyebaran data cacat ke sistem downstream, sehingga memastikan output tugas sesuai ekspektasi dan tidak memengaruhi keputusan bisnis. Selain itu, fitur ini secara signifikan mengurangi waktu dan biaya troubleshooting serta eksekusi ulang tugas. Untuk informasi lebih lanjut, lihat Kualitas Data.

Batasan

  • Jenis tabel yang didukung untuk pemantauan meliputi MaxCompute, E-MapReduce, Hologres, CDH Hive, AnalyticDB for PostgreSQL, AnalyticDB for MySQL, dan StarRocks.

  • Anda hanya dapat memantau tabel yang memenuhi kondisi berikut:

    • Tabel tersebut harus termasuk dalam Sumber Data yang terikat ke Ruang Kerja tempat node tersebut berada.

    • Setiap node hanya dapat memantau satu tabel, tetapi Anda dapat mengonfigurasi beberapa aturan pemantauan untuk tabel tersebut. Cakupan pemantauan bervariasi tergantung jenis tabel:

      • Untuk Tabel Non-partisi, seluruh tabel dipantau secara default.

      • Untuk Tabel Partisi, Anda harus menggunakan ekspresi partisi untuk menentukan partisi yang akan dipantau.

      Catatan

      Jika Anda perlu memantau beberapa tabel, buat node terpisah untuk setiap tabel.

  • Batasan operasional berikut berlaku:

    • Aturan Pemantauan Kualitas Data yang dibuat di DataStudio hanya dapat dijalankan, dimodifikasi, dan dipublikasikan di dalam DataStudio. Anda dapat melihat aturan ini di modul Kualitas Data, tetapi tidak dapat memicu eksekusi terjadwal atau melakukan operasi manajemen di sana.

    • Jika Anda memodifikasi Aturan Pemantauan di Node Pemantauan Kualitas Data lalu menerbitkan node tersebut, Aturan Pemantauan asli yang dihasilkannya akan ditimpa.

Prasyarat

  • Anda telah mengikat Resource Compute dan membuat tabel yang akan dipantau di resource tersebut.

    Sebelum menjalankan tugas Pemantauan Kualitas Data, pastikan tabel yang akan dipantau telah dibuat. Untuk informasi lebih lanjut, lihat Mengaitkan resource komputasi dan Pengembangan node.

  • Anda telah membuat Resource Group.

    Hanya Resource Group Serverless yang dapat digunakan untuk menjalankan Node Pemantauan Kualitas Data. Untuk informasi lebih lanjut, lihat Manajemen kelompok sumber daya.

  • (Opsional, wajib untuk pengguna RAM) Pengguna RAM untuk pengembangan tugas telah ditambahkan ke Ruang Kerja yang sesuai dan diberi peran Developer atau Workspace Administrator. Perhatikan bahwa peran Workspace Administrator memiliki izin yang luas dan harus diberikan dengan hati-hati. Untuk informasi lebih lanjut tentang penambahan anggota dan pemberian izin, lihat Menambahkan anggota ke ruang kerja.

Langkah 1: Buat node pemantau kualitas

  1. Buka halaman Workspaces di Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Temukan ruang kerja yang diinginkan dan pilih Shortcuts > Data Studio di kolom Actions.

  2. Di panel navigasi kiri, klik image untuk membuka DataStudio. Di sebelah kanan Business Flow, klik image dan pilih Create Node > Data Quality > Quality Monitor. Ikuti petunjuk di layar untuk memasukkan path dan nama node, lalu buat node tersebut.

Langkah 2: Mengonfigurasi aturan pemantauan kualitas data

1. Pilih tabel

Di halaman konfigurasi Node Pemantauan Kualitas Data, klik Add Table. Di kotak dialog Add Table, pilih tabel yang akan dipantau. Anda dapat menggunakan filter More untuk menemukan tabel dengan cepat.image

Catatan

Jika tabel tidak ditampilkan, buka My Data untuk mencari dan mengelolanya.

2. Tentukan cakupan data

  • Untuk Tabel Non-partisi, seluruh tabel dipantau secara default. Anda dapat melewati langkah ini.

  • Untuk Tabel Partisi, Anda harus memilih partisi tertentu yang akan dipantau. Anda dapat menggunakan Scheduling Parameter dalam ekspresi tersebut. Klik Preview untuk memverifikasi bahwa Ekspresi Partisi dievaluasi dengan benar.

3. Konfigurasikan aturan pemantauan kualitas data

Anda dapat membuat aturan baru atau mengimpor aturan yang sudah ada. Secara default, semua aturan yang dikonfigurasi diaktifkan.

Catatan
  • Node Pemantauan Kualitas Data mendukung fitur Copilot Rule Recommendation, yang secara cerdas menghasilkan aturan kualitas berdasarkan informasi tabel Anda. Anda dapat memilih untuk menerima atau menolak saran ini sesuai kebutuhan.

  • Fitur DataWorks Copilot Code Programming Assistant sedang dalam pratinjau publik di beberapa wilayah. Jika fitur ini tidak tersedia di wilayah Anda, Anda dapat membuat atau mengimpor aturan secara manual seperti yang dijelaskan di bawah.

  • Buat aturan

    Klik Create Rule untuk membuat Aturan Pemantauan Kualitas Data berdasarkan templat atau SQL kustom. Bagian berikut menjelaskan metode-metode tersebut.

    Templat sistem

    Platform menyediakan berbagai Aturan Pemantauan bawaan. Anda dapat menggunakan templat ini untuk membuat Aturan Pemantauan Kualitas Data dengan cepat. Gambar berikut mengilustrasikan proses ini.

    Catatan

    Sebagai alternatif, Anda dapat menemukan templat aturan di daftar templat sistem di sebelah kiri dan klik + Use untuk membuat aturan.

    image

    Parameter templat aturan sistem

    Parameter

    Description

    Rule Name

    Nama aturan pemantauan.

    Template

    Tentukan jenis validasi aturan yang perlu dilakukan pada tabel.

    Data Quality menyediakan banyak templat aturan bawaan tingkat tabel dan tingkat bidang yang siap digunakan. Untuk informasi selengkapnya, lihat Lihat templat aturan bawaan.

    Catatan

    Anda hanya dapat mengonfigurasi aturan pemantauan tingkat bidang berikut untuk bidang numerik: nilai rata-rata, jumlah nilai, nilai minimum, dan nilai maksimum.

    Rule Scope

    Cakupan penerapan aturan. Untuk aturan pemantauan tingkat tabel, cakupan penerapannya adalah tabel saat ini secara default. Untuk aturan pemantauan tingkat bidang, cakupan penerapannya adalah bidang tertentu.

    Comparison Method

    Metode perbandingan yang digunakan oleh aturan untuk memeriksa apakah data tabel sesuai dengan yang diharapkan.

    • Manual Settings: Anda dapat mengonfigurasi metode perbandingan untuk membandingkan hasil output data dengan hasil yang diharapkan berdasarkan kebutuhan bisnis Anda.

      Anda dapat memilih metode perbandingan yang berbeda untuk templat aturan yang berbeda. Anda dapat melihat metode perbandingan yang didukung oleh suatu templat aturan di Konsol DataWorks.

      • Untuk hasil numerik, Anda dapat membandingkan hasil numerik dengan nilai tetap, yaitu nilai yang diharapkan. Metode perbandingan berikut didukung: Greater Than, Greater Than Or Equal To, Equal To, Not Equal To, Less Than, dan Less Than Or Equal To. Anda dapat mengonfigurasi rentang data normal (normal threshold) dan rentang data abnormal (red threshold) berdasarkan kebutuhan bisnis Anda.

      • Untuk hasil fluktuasi, Anda dapat membandingkan hasil fluktuasi dengan rentang fluktuasi. Metode perbandingan berikut didukung: Absolute Value, Raise, dan Drop. Anda dapat mengonfigurasi rentang data normal (normal threshold) berdasarkan kebutuhan bisnis Anda. Anda juga dapat menentukan pengecualian output data (orange threshold) dan output data yang tidak terduga (red threshold) berdasarkan tingkat penyimpangan abnormal.

    • Intelligent Dynamic Threshold: Jika Anda memilih opsi ini, Anda tidak perlu mengonfigurasi ambang batas fluktuasi atau nilai yang diharapkan secara manual. Sistem secara otomatis menentukan ambang batas yang wajar berdasarkan algoritma cerdas. Jika data abnormal terdeteksi, peringatan segera dipicu atau task terkait segera diblokir. Saat parameter Comparison Method diatur ke Intelligent Dynamic Threshold, Anda dapat mengonfigurasi parameter Degree of importance.

      Catatan

      Hanya aturan pemantauan yang dikonfigurasi berdasarkan custom SQL statement, custom range, atau dynamic threshold yang mendukung metode perbandingan intelligent dynamic threshold.

    Monitoring Threshold

    • Jika Anda mengatur parameter Comparison Method ke Manual Settings, Anda dapat mengonfigurasi parameter Normal Threshold dan Red Threshold.

      • Normal Threshold: Jika hasil pemeriksaan kualitas data memenuhi kondisi yang ditentukan, output data sesuai dengan yang diharapkan.

      • Red Threshold: Jika hasil pemeriksaan kualitas data memenuhi kondisi yang ditentukan, output data tidak sesuai dengan yang diharapkan.

    • Jika aturan yang Anda konfigurasi merupakan aturan Intelligent Dynamic Threshold, Anda harus mengonfigurasi Orange Threshold.

      • Orange Threshold: Jika hasil pemeriksaan kualitas data memenuhi kondisi yang ditentukan, data bersifat abnormal tetapi bisnis Anda tidak terpengaruh.

    Retain problem data

    Jika aturan pemantauan diaktifkan dan pemeriksaan kualitas data berdasarkan aturan tersebut gagal, sistem secara otomatis membuat tabel untuk menyimpan data bermasalah yang teridentifikasi selama pemeriksaan kualitas data.

    Penting
    • Parameter Retain problem data tersedia untuk tabel MaxCompute dan Hologres.

    • Parameter Retain problem data hanya tersedia untuk aturan pemantauan tertentu dalam Data Quality.

    • Jika Anda Disable aturan pemantauan, data bermasalah tidak akan disimpan.

    Status

    Menentukan apakah aturan di Enable atau Disable di lingkungan produksi.

    Penting

    Jika Anda Disable aturan, aturan tersebut tidak dapat dipicu untuk menjalankan uji coba atau dipicu oleh node penjadwalan terkait.

    Degree of importance

    Tingkat kepentingan aturan dalam bisnis Anda.

    • Aturan kuat (Strong rules) adalah aturan penting. Jika Anda mengatur parameter ini ke Strong rules dan ambang batas kritis terlampaui, node penjadwalan yang terkait dengan monitor tersebut akan diblokir secara default.

    • Aturan lemah (Weak rules) adalah aturan biasa. Jika Anda mengatur parameter ini ke Weak rules dan ambang batas kritis terlampaui, node penjadwalan yang terkait dengan monitor tersebut tidak akan diblokir secara default.

    Configuration Source

    Sumber konfigurasi aturan. Nilai default-nya adalah Data Quality.

    Description

    Anda dapat menambahkan deskripsi tambahan untuk aturan tersebut.

    Templat kustom

    Sebelum menggunakan metode ini, Anda harus terlebih dahulu membuka Data Quality > Rule Assets > Rule Templates untuk membuat templat aturan kustom. Anda kemudian dapat menggunakan templat ini untuk membuat Aturan Pemantauan Kualitas Data. Untuk informasi lebih lanjut, lihat Membuat dan mengelola templat aturan kustom.

    Gambar berikut menunjukkan cara membuat Aturan Kualitas Data berdasarkan templat kustom.

    Catatan

    Sebagai alternatif, Anda dapat menemukan templat aturan kustom di daftar templat kustom di sebelah kiri dan klik + Use untuk membuat aturan.

    image

    Parameter templat aturan kustom

    Hanya parameter yang unik untuk aturan berdasarkan templat aturan kustom yang dijelaskan dalam tabel berikut. Untuk informasi tentang parameter lainnya, lihat parameter untuk mengonfigurasi aturan berdasarkan templat aturan bawaan.

    Parameter

    Deskripsi

    FLAG parameter

    Pernyataan SET yang ingin Anda eksekusi sebelum pernyataan SQL dalam aturan dieksekusi.

    SQL

    Pernyataan SQL yang menentukan logika pemeriksaan lengkap. Hasil yang dikembalikan harus berupa angka dan terdiri dari satu baris dan satu kolom.

    Dalam pernyataan SQL kustom, sertakan ekspresi filter partisi dalam tanda kurung []. Contoh:

    SELECT count(*) FROM ${tableName} WHERE ds=$[yyyymmdd];
    Catatan
    • Dalam pernyataan ini, nilai variabel ${tableName} secara dinamis diganti dengan nama tabel tempat Anda mengonfigurasi aturan pemantauan.

    • Untuk informasi tentang cara mengonfigurasi ekspresi filter partisi, lihat bagian Lampiran 2: Ekspresi filter partisi bawaan dalam topik ini.

    • Jika Anda telah membuat monitor untuk tabel tersebut, pengaturan partisi tabel yang Anda tentukan dalam parameter Data Range selama konfigurasi monitor tidak lagi berlaku untuk tabel tersebut setelah Anda mengonfigurasi parameter ini. Aturan menentukan partisi tabel yang akan diperiksa berdasarkan pengaturan WHERE dalam pernyataan SQL.

    SQL kustom

    Metode ini memungkinkan Anda menentukan logika validasi kualitas data kustom untuk tabel Anda.

    image

    Parameter SQL kustom

    Hanya parameter yang unik untuk SQL kustom yang ditampilkan di sini. Untuk penjelasan parameter lainnya, lihat deskripsi parameter templat aturan sistem.

    Parameter

    Deskripsi

    FLAG parameter

    Pernyataan SET yang ingin Anda eksekusi sebelum pernyataan SQL dalam aturan dieksekusi.

    SQL

    Pernyataan SQL yang menentukan logika pemeriksaan lengkap. Hasil yang dikembalikan harus berupa angka dan terdiri dari satu baris dan satu kolom.

    Dalam pernyataan SQL kustom, sertakan ekspresi filter partisi dalam tanda kurung []. Contoh:

    SELECT count(*) FROM <table_name> WHERE ds=$[yyyymmdd];
    Catatan
    • Anda harus mengganti <table_name> dengan nama tabel tempat Anda mengonfigurasi aturan pemantauan. Pernyataan SQL menentukan tabel yang perlu dipantau.

    • Untuk informasi tentang cara mengonfigurasi ekspresi filter partisi, lihat bagian Lampiran 2: Ekspresi filter partisi bawaan dalam topik ini.

    • Jika Anda telah membuat monitor untuk tabel tersebut, pengaturan partisi tabel yang Anda tentukan dalam parameter Data Range selama konfigurasi monitor tidak lagi berlaku untuk tabel tersebut setelah Anda mengonfigurasi parameter ini. Aturan menentukan partisi tabel yang akan diperiksa berdasarkan pengaturan WHERE dalam pernyataan SQL.

  • Impor aturan yang sudah ada

    Jika Anda telah membuat Aturan Pemantauan untuk tabel target di modul Data Quality, Anda dapat mengimpornya untuk mereplikasi aturan tersebut dengan cepat. Jika tidak ada aturan yang tersedia, Anda harus terlebih dahulu membuatnya di modul Data Quality. Untuk informasi lebih lanjut, lihat Mengonfigurasi aturan: Berdasarkan tabel (tabel tunggal).

    Catatan

    Metode ini memungkinkan Anda mengimpor beberapa aturan sekaligus dan mengonfigurasinya di tingkat tabel atau bidang.

    Klik Import Rule. Anda kemudian dapat mencari dan memilih aturan yang akan diimpor berdasarkan ID atau nama aturan, templat aturan, atau cakupan terkait (seluruh tabel atau bidang tabel tertentu).

    image

Catatan

Setelah Anda menerbitkan Data Quality Monitoring Node, Anda dapat melihat detail Aturan Pemantauan node tersebut di modul Data Quality. Namun, Anda tidak dapat memodifikasi atau menghapus aturan ini dari modul Data Quality.

4. Konfigurasikan resource waktu proses

Pilih Resource Waktu Proses yang diperlukan untuk menjalankan pemeriksaan aturan kualitas. Resource ini menentukan sumber data tempat tugas pemantauan dijalankan. Secara default, ini adalah sumber data yang sama yang berisi tabel yang dipantau.

Catatan

Jika Anda memilih Sumber Data yang berbeda, pastikan sumber data tersebut memiliki Izin Akses yang diperlukan untuk tabel tersebut.

Langkah 3: Mengonfigurasi kebijakan penanganan peringatan

Di bagian Quality Monitor Handler pada halaman konfigurasi node, Anda dapat mengonfigurasi kebijakan penanganan dan metode langganan untuk peringatan yang dipicu oleh pemeriksaan kualitas data.

Kategori peringatan

Kategori peringatan

Deskripsi

Strong Rule Check Fails

  • Strong dan Weak menunjukkan tingkat kepentingan aturan.

  • Red Abnormal: Metrik validasi data mencapai rentang ambang batas merah untuk kualitas abnormal. Rentang ini biasanya berarti validasi data tidak memenuhi ekspektasi dan akan sangat memengaruhi operasi bisnis selanjutnya.

  • Orange Abnormal: Metrik validasi data mencapai rentang ambang batas oranye untuk kualitas abnormal. Rentang ini biasanya berarti validasi data abnormal tetapi tidak memengaruhi operasi bisnis selanjutnya.

  • Check Failed: Tugas validasi gagal dijalankan. Misalnya, partisi yang dipantau tidak dihasilkan, atau skrip SQL yang digunakan untuk pemantauan gagal dijalankan.

Strong Rule Red Alert

Strong Rule Orange Alert

Weak Rule Check Fails

Weak Rule Red Alert

Weak Rule Orange Alert

Kebijakan penanganan peringatan

Anda dapat mengonfigurasi kebijakan penanganan untuk peringatan yang dipicu oleh pemeriksaan aturan:

  • Continue: Kebijakan ini memungkinkan Anda mengonfigurasi sistem untuk menghentikan node saat ini dan menandainya sebagai gagal jika peringatan tertentu terdeteksi, seperti Peringatan Kritis dari Aturan Kuat.

    Catatan
    • Saat node saat ini gagal, Node Downstream tidak akan dijalankan. Hal ini memblokir pipeline produksi dan mencegah penyebaran data bermasalah.

    • Anda dapat mengonfigurasi kebijakan ini untuk memeriksa beberapa kategori peringatan.

    • Kebijakan ini biasanya digunakan ketika peringatan menunjukkan masalah serius yang harus memblokir tugas downstream.

  • Ignore: Mengabaikan peringatan dan memungkinkan node downstream untuk terus berjalan.

Metode langganan peringatan

Anda dapat mengonfigurasi cara menerima notifikasi peringatan, misalnya melalui email. Saat peringatan dipicu, platform mengirimkan notifikasi melalui saluran yang ditentukan, sehingga Anda dapat segera menemukan dan menangani masalah tersebut.

Catatan

Platform mendukung berbagai metode notifikasi, yang dapat bervariasi tergantung antarmuka pengguna. Metode yang didukung meliputi:

  • Untuk notifikasi melalui Email, Email dan SMS, atau Telepon, Anda hanya dapat memilih pengguna di bawah akun saat ini sebagai penerima. Pastikan informasi kontak pengguna tersebut benar. Untuk informasi lebih lanjut, lihat Melihat dan mengatur kontak peringatan.

  • Untuk metode lainnya, Anda harus memasukkan URL Webhook untuk menerima notifikasi. Untuk informasi lebih lanjut tentang cara mendapatkan URL, lihat Mendapatkan URL Webhook.

Langkah 4: Mengonfigurasi penjadwalan tugas

Jika Anda perlu menjalankan tugas node secara terjadwal, klik Properties di sisi kanan halaman konfigurasi node. Konfigurasikan informasi penjadwalan untuk node tersebut berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Konfigurasi penjadwalan node.

Langkah 5: Debug tugas

Anda dapat melakukan operasi debugging berikut untuk memverifikasi bahwa tugas berjalan sesuai ekspektasi.

  1. (Opsional) Pilih kelompok sumber daya untuk penjadwalan dan tetapkan nilai ke parameter kustom.

    • Di sisi kanan Node Pemantauan Kualitas Data, klik Run Configuration dan konfigurasikan Scheduling Resource Group untuk eksekusi debugging.

    • Jika tugas Anda menggunakan parameter penjadwalan, Anda dapat menetapkan nilai ke variabel di bagian Parameters untuk debugging. Untuk informasi lebih lanjut tentang logika penetapan parameter, lihat Proses debugging tugas.

  2. Simpan dan jalankan tugas.

    Klik ikon image di bilah alat atas untuk menyimpan tugas. Klik ikon image untuk menjalankan tugas.

    Setelah tugas selesai dijalankan, Anda dapat melihat hasilnya di bagian bawah halaman konfigurasi node. Jika eksekusi gagal, Anda dapat melakukan troubleshooting berdasarkan pesan error.

Langkah 6: Terbitkan tugas

Setelah Anda mengonfigurasi tugas node, Anda harus menerbitkannya. Setelah diterbitkan, node tersebut berjalan secara berkala berdasarkan Konfigurasi Penjadwalannya.

Catatan

Saat Anda menerbitkan Node Pemantauan Kualitas Data, aturan kualitas yang dikonfigurasi juga diterbitkan.

  1. Klik ikon image di bilah alat atas untuk Save node.

  2. Klik ikon image di bilah alat atas untuk Publish node.

Untuk informasi lebih lanjut tentang penerbitan node, lihat Penerapan node dan alur kerja.

Langkah selanjutnya

  • O&M Tugas: Setelah tugas diterbitkan, tugas tersebut berjalan secara berkala berdasarkan Konfigurasi Penjadwalan node. Anda dapat mengklik O&M di pojok kanan atas halaman konfigurasi node untuk membuka Pusat O&M. Di sana, Anda dapat melihat status penjadwalan dan eksekusi tugas berkala, termasuk status node dan detail aturan yang dipicu. Untuk informasi lebih lanjut, lihat Mengelola tugas yang dipicu otomatis.

  • Kualitas Data: Setelah Aturan Pemantauan Kualitas Data diterbitkan, Anda juga dapat membuka modul Kualitas Data untuk melihat detailnya. Namun, Anda tidak dapat melakukan operasi manajemen seperti memodifikasi atau menghapus aturan dari sana. Untuk informasi lebih lanjut, lihat Kualitas Data.