Untuk memastikan bahwa data yang dihasilkan oleh node memenuhi ekspektasi Anda, Anda dapat mengonfigurasi pemantauan kualitas data. Topik ini menjelaskan cara mengonfigurasi pemantauan kualitas data untuk tabel dwd_log_info_di_emr.
Prasyarat
Sebelum memulai, pastikan Anda telah menyelesaikan prosedur dalam Sinkronisasi data dan Pemrosesan data.
Langkah 1: Buka konfigurasi aturan
Masuk ke DataWorks console. Di wilayah target, klik di panel navigasi sebelah kiri. Pilih ruang kerja dari daftar drop-down dan klik Go to Data Quality.
-
Buka halaman konfigurasi aturan untuk tabel tersebut.
Di panel navigasi sebelah kiri halaman Data Quality, klik . Temukan tabel target berdasarkan parameter berikut:
-
Connection: E-MapReduce.
-
Table: Dalam tutorial ini, Anda perlu mengonfigurasi aturan pemantauan untuk tabel
dwd_log_info_di_emr.
-
-
Pada hasil pencarian, temukan tabel target dan klik Rule Management di kolom Actions untuk membuka halaman detail kualitas tabel tersebut.
Langkah 2: Konfigurasikan Monitor
Monitor memeriksa apakah data dalam rentang data (partisi) tertentu dari tabel target memenuhi ekspektasi Anda.
Pada langkah ini, atur Data Range Monitor menjadi dt=$[yyyymmdd-1]. Saat Monitor dijalankan, data dalam partisi yang sesuai akan diperiksa untuk menentukan apakah memenuhi persyaratan kualitas.
Artinya, setiap kali node penjadwalan untuk tabel dwd_log_info_di_emr dijalankan, Monitor tersebut akan dipicu. Monitor kemudian menggunakan aturan kualitas terkaitnya untuk memvalidasi data dalam rentang data yang ditentukan.
Ikuti langkah-langkah berikut:
-
Di tab Monitor, klik Create Monitor.
-
Konfigurasikan parameter Monitor. Parameter utama dijelaskan sebagai berikut:
Parameter
Contoh
Data Range
dt=$[yyyymmdd-1]
Monitoring Rule
Akan dikonfigurasi pada langkah berikutnya.
Trigger Method
Pilih Triggered by production scheduling dan pilih node
dwd_log_info_di_emryang telah Anda buat dalam topik Pemrosesan data.CatatanUntuk informasi lebih lanjut tentang cara mengonfigurasi Monitor, lihat Konfigurasi aturan: Berdasarkan tabel (tabel tunggal).
Langkah 3: Konfigurasikan aturan pemantauan
Tabel dwd_log_info_di_emr digunakan untuk memproses data dari tabel ods_raw_log_d_emr. Untuk mencegah pemrosesan tidak valid dan masalah kualitas, Anda mengonfigurasi Strong Rule berdasarkan templat Table is not empty. Aturan ini menentukan apakah node leluhur telah menulis data ke partisi tabel.
Jika jumlah baris yang dipantau pada partisi terkait di tabel dwd_log_info_di_emr adalah 0, peringatan akan dipicu, dan node dwd_log_info_di_emr gagal serta keluar, sehingga menghentikan eksekusi node turunan dari node dwd_log_info_di_emr.
Ikuti langkah-langkah berikut:
-
Di tab Rule Management, di bawah Monitor Perspective, pilih Monitor yang telah Anda buat (misalnya,
raw_log_number_of_table_rows_not_0), lalu klik Create Rule untuk membuka panel Create Rule. -
Di tab System Template, temukan aturan The number of rows is greater than 0. dan klik Use. Kemudian, ubah Degree of importance menjadi Strong rules.
CatatanDalam tutorial ini, aturan didefinisikan sebagai Strong Rule. Artinya, jika Monitor menemukan bahwa tabel
dwd_log_info_di_emrmemiliki nol baris, peringatan akan dipicu dan semua node turunan akan diblokir. -
Klik Determine.
CatatanUntuk informasi lebih lanjut tentang item konfigurasi lainnya, lihat Konfigurasi aturan: Berdasarkan tabel (tabel tunggal).
Langkah 4: Uji Monitor
Anda dapat menjalankan pengujian untuk memverifikasi bahwa aturan pemantauan telah dikonfigurasi dengan benar dan berfungsi sesuai harapan.
-
Klik Test Run untuk membuka kotak dialog Test Run.
-
Di kotak dialog Test Run, pilih Data Timestamp dan klik Test Run.
-
Setelah pengujian selesai, ikuti petunjuk di layar dan klik View Details untuk memeriksa hasilnya.
Tab Current Run Record menampilkan informasi dalam tiga bagian: Informasi Aturan (termasuk nama aturan, ID, cakupan, templat, tingkat kepentingan, metode perbandingan, dan ambang batas); Informasi Eksekusi Tugas Deteksi (termasuk metode pemicu, waktu pemicu aturan, tanggal bisnis, waktu mulai aktual, dan waktu akhir aturan); serta Hasil Pengumpulan dan Perbandingan Kualitas (termasuk status pemeriksaan, hasil pemeriksaan, nilai garis dasar, nilai sampel, dan nilai pemeriksaan).
Langkah 5: Berlangganan Monitor
Data Quality menyediakan fitur pemantauan dan peringatan. Berlangganan Monitor untuk menerima peringatan tepat waktu saat pemeriksaan kualitas gagal. Hal ini memungkinkan Anda menyelesaikan masalah dengan cepat dan memastikan data diproduksi secara aman dan tepat waktu.
-
Di tab Rule Management, klik Subscribe to Alerts. Di kotak dialog Subscribe to Alerts, pilih metode langganan dan penerima, lalu klik Save.
-
Lihat dan modifikasi langganan.
Setelah mengonfigurasi langganan, di panel navigasi sebelah kiri, klik . Lalu, klik tab My Subscriptions untuk melihat dan memodifikasi langganan Anda.
Langkah selanjutnya
Setelah memproses data, Anda dapat menggunakan modul DataAnalysis untuk visualisasi data. Untuk informasi lebih lanjut, lihat Visualisasi data.