Aturan pemantauan kustom membantu Anda memantau status eksekusi tugas atau penggunaan sumber daya sesuai kebutuhan bisnis. Fitur ini memungkinkan Anda mendeteksi dan menangani pengecualian secara cepat. Topik ini menjelaskan cara membuat aturan peringatan kustom di halaman Manajemen Aturan serta cara menambahkan chatbot DingTalk untuk mendapatkan URL webhook.
Batasan
Aturan pemantauan kustom hanya berlaku untuk Recurring Instances yang dijadwalkan secara otomatis dan tidak memantau hasil eksekusi tugas yang dipicu secara manual maupun tugas pengisian ulang data.
Aturan pemantauan kustom dapat mengirim pemberitahuan peringatan melalui metode berikut: Email, Text Message, Phone Call, DingTalk Chatbot, dan Webhook. Batasan penggunaannya adalah sebagai berikut:
Phone Call: Hanya menyediakan peringatan panggilan telepon ke nomor ponsel di Daratan Tiongkok.
Webhook:
DataWorks Edisi Dasar mendukung pengiriman peringatan ke grup DingTalk, Lark, dan WeCom menggunakan webhook grup.
DataWorks Edisi Perusahaan mendukung semua fitur Edisi Dasar dan juga memungkinkan Anda mengonfigurasi webhook pengguna kustom untuk menerima peringatan.
CatatanUntuk informasi selengkapnya tentang cara mengonfigurasi webhook kustom, lihat Intelligent Monitoring Custom Webhook. Setelah konfigurasi selesai, kirimkan Tiket untuk menghubungi kami guna pemrosesan lebih lanjut.
Kondisi pemicu seperti Instances With Errors, Proportion Of Instances With Errors, and Node Logs Contain Keywords hanya tersedia di DataWorks Professional Edition atau edisi yang lebih tinggi. Untuk informasi selengkapnya, lihat Fitur edisi DataWorks. Untuk informasi tentang cara mengaktifkan DataWorks, lihat Panduan pembelian.
Hanya Pemilik aturan pemantauan, administrator penyewa, atau akun root yang dapat mengubah aturan tersebut.
Perhatian
Saat Anda menggunakan aturan pemantauan kustom untuk memantau recurring instances, rentang waktu pemantauan bervariasi tergantung pada kondisi pemicu peringatan.
Cakupan pemantauan | Kondisi pemicu | Deskripsi |
Data per kemarin |
| DataWorks memantau recurring instances yang memiliki waktu data kemarin dan waktu terjadwal hari ini. Peringatan dipicu jika kondisi terpenuhi. |
Stempel waktu data: T = kemarin, T–1 = kemarin lusa |
| DataWorks memantau instans berulang dengan Waktu data kemarin dan waktu terjadwal hari ini, serta instans dengan Waktu data kemarin lusa dan waktu terjadwal kemarin. Peringatan akan dipicu jika kondisi terpenuhi. |
Stempel waktu data: Kemarin (T), kemarin lusa (T–1), dan dua hari sebelum kemarin (T–2) |
| DataWorks memantau recurring instances berikut: instans dengan waktu data kemarin dan waktu terjadwal hari ini, instans dengan waktu data lusa dan waktu terjadwal kemarin, serta instans dengan waktu data dua hari sebelum kemarin dan waktu terjadwal lusa. Peringatan dipicu jika kondisi terpenuhi. |
Recurring instances yang berada di luar cakupan pemantauan tidak akan memicu peringatan, meskipun memenuhi kondisi pemicu. Untuk informasi selengkapnya tentang aturan pemantauan untuk berbagai kondisi pemicu, lihat Buat aturan kustom.
Buka halaman Manajemen Aturan
Buka halaman Operation Center.
Di panel navigasi kiri, klik .
CatatanAnda juga dapat membuka halaman tugas yang dipicu otomatis untuk memilih beberapa node sekaligus dan membuat aturan pemantauan. Untuk informasi selengkapnya, lihat Kelola tugas yang dipicu otomatis.
Masuk ke Konsol DataWorks. Alihkan ke wilayah tujuan. Di panel navigasi sebelah kiri, klik . Pilih ruang kerja target dari daftar drop-down dan klik Go to Operation Center.
Buat aturan kustom
Di halaman Manajemen Aturan, Anda dapat membuat aturan pemantauan kustom sesuai kebutuhan bisnis Anda.
Konfigurasikan informasi dasar
Parameter | Deskripsi |
Rule Name | Masukkan nama untuk aturan kustom. |
Object Type | Jenis objek yang ingin Anda pantau. Nilai yang valid: Node, Baseline, Workspace, Workflow, Exclusive Resource Group For Scheduling, dan Exclusive Resource Group For Data Integration. Catatan Jika Anda mengatur Object Type ke Baseline, sistem hanya memantau status berjalan tugas pada baseline tersebut. Sistem tidak memantau tugas hulu dari tugas baseline. Untuk memantau tugas hulu juga, lihat Ikhtisar baseline cerdas. |
Rule Object | Tentukan objek yang dipantau. Masukkan nama atau ID objek, pilih objek dari daftar, lalu klik Add. Jenis objek yang didukung dan jumlah maksimumnya adalah:
|
Task Whitelist | Tentukan tugas mana di antara objek yang dipantau yang dikecualikan dari aturan ini. Ketika Object Type adalah Baseline, Workspace, atau Business Flow, Anda dapat memasukkan Node Name/ID dan mengklik tombol Add untuk menambahkan tugas ke daftar putih. Catatan Tugas dalam daftar putih tidak dipantau. Anda dapat menambahkan hingga 50 tugas. |
Resource Group Name | Tentukan nama kelompok sumber daya eksklusif yang ingin dipantau. Jika Object Type diatur ke Exclusive Resource Group For Scheduling atau Exclusive Resource Group For Data Integration, Anda harus memilih Resource Group Name dari daftar drop-down. |
Konfigurasikan metode pemicu
Dalam logika peringatan kustom, tugas dalam status Frozen dianggap telah selesai.
Jenis objek | Kondisi pemicu | Deskripsi |
Node, Baseline, Workspace, atau Workflow | Completed | Sistem memantau tugas sejak waktu mulainya dan mengirim peringatan ketika tugas berhasil dijalankan.
Catatan Untuk tugas per jam, tugas dianggap selesai hanya setelah semua recurring instances-nya berhasil dijalankan. |
Not completed | Sistem memantau tugas sejak waktu mulainya dan mengirim peringatan jika tugas belum selesai dijalankan pada waktu tertentu. Catatan Peringatan ini berbeda dari kebijakan peringatan baseline cerdas. Baseline cerdas dapat mendeteksi pengecualian yang mencegah tugas pada baseline selesai tepat waktu dan memberikan peringatan dini. Untuk informasi selengkapnya, lihat Ikhtisar baseline cerdas. Skenario:
Catatan Untuk tugas per jam atau per menit, sistem memeriksa apakah semua recurring instances hari itu belum selesai pada waktu yang ditentukan. | |
Failed | Sistem memantau tugas sejak waktu mulainya dan mengirim peringatan jika eksekusi tugas gagal. Catatan Jika instans node gagal dijalankan, ikon
| |
Number of failed instances | Jumlah instans dalam status Failed. Ini mencakup instans yang gagal dalam pemeriksaan DQC atau eksekusi logika kode. Jika Object Type diatur ke Workspace dan Trigger Condition diatur ke Instances With Errors, Anda harus mengonfigurasi ambang batas. Peringatan dipicu ketika jumlah instans dengan kesalahan mencapai ambang batas tersebut. Catatan
| |
Proportion of failed instances | Ketika Object Type diatur ke Workspace dan Anda memilih Proportion Of Instances With Errors sebagai Trigger Condition, Anda harus mengonfigurasi ambang batas. Peringatan dipicu ketika proporsi instans dengan kesalahan terhadap total jumlah instans hari itu mencapai ambang batas tersebut. Catatan
| |
Task logs contain keywords | Ketika Workspace adalah Workspace dan Anda memilih Task Log Contains Keywords sebagai Trigger Condition, Anda harus mengonfigurasi kata kunci. Peringatan dipicu jika log operasional tugas untuk hari ini berisi kata kunci tersebut. Catatan
| |
Not completed in epoch | Sistem mengirim peringatan jika tugas belum selesai dijalankan dalam epoch tertentu. Ini biasanya digunakan untuk memantau instans tugas per jam. Ketika Anda mengonfigurasi pemantauan Incomplete In Cycle untuk workflow, sistem memantau tugas dalam workflow tersebut, seperti tugas yang dijadwalkan berjalan per hari, per jam, atau per menit, berdasarkan siklus N yang Anda tetapkan. Jika jumlah instans untuk suatu tugas kurang dari N, sistem mengabaikan peringatan untuk tugas tersebut. Contohnya, jika Anda mengatur epoch ke 3 untuk business flow dengan dua tugas berikut, peringatan akan sebagai berikut:
| |
Timeout | Sistem memantau tugas sejak waktu mulainya dan mengirim peringatan jika tugas masih berjalan setelah durasi tertentu. Ini biasanya digunakan untuk memantau waktu proses tugas. | |
Error persists after automatic rerun | Sistem memantau tugas sejak waktu mulainya dan mengirim peringatan jika tugas gagal dan tetap gagal setelah rerun otomatis. Catatan Jika Anda ingin peringatan dilaporkan setiap kali terjadi kesalahan saat node berjalan, Anda dapat mengatur kondisi pemicu ke Error. | |
Task converted to instance | Anda hanya dapat memilih kondisi pemicu ini ketika Object Type diatur ke Workspace. | |
Instance count fluctuation | Anda hanya dapat mengatur kondisi pemicu ke Fluctuation of Instance Count ketika parameter Object Type diatur ke Workspace. DataWorks menghasilkan instans node yang dipicu otomatis yang perlu dijalankan keesokan harinya sebelum pukul 24.00 setiap hari. Ketika jumlah instans node yang dipicu otomatis yang dihasilkan di workspace Anda berfluktuasi secara signifikan dibandingkan dengan rata-rata jumlah instans node yang dipicu otomatis yang secara historis dihasilkan di workspace tersebut, Anda akan menerima peringatan. | |
Exclusive Resource Group For Scheduling atau Exclusive Resource Group For Data Integration | Resource group utilization | Peringatan ini dipicu ketika Utilization melebihi nilai tertentu selama durasi tertentu. Contoh: Jika Resource Group Usage lebih dari 50% selama 15 menit, peringatan dipicu. |
Number of instances waiting for resources in the resource group | Alarm ini dipicu ketika Number Of Resource Instances In The Resource Group melebihi nilai tertentu selama periode tertentu. Contoh: Peringatan dipicu jika Number of resource instances in a resource group lebih dari 10 selama 15 menit. |
Konfigurasikan perilaku peringatan
Metode peringatan | Penerima peringatan | Deskripsi |
Email, Text Message, Phone | Anda dapat mengirim peringatan ke Node Owner, Shift Schedule, atau Others. |
|
DingTalk Chatbot Webhook | Anggota grup |
|
Konfigurasikan kontrol kelelahan
Parameter | Deskripsi |
Maximum Alerts | Jumlah maksimum peringatan. Setelah jumlah ini tercapai, tidak ada peringatan tambahan yang dihasilkan. |
Minimum Alert Interval | Interval waktu minimum antara dua peringatan. |
Do-not-disturb Period | Setelah Anda mengatur periode jangan ganggu, sistem tidak akan mengirim peringatan selama periode ini. Contohnya, Anda mengonfigurasi peringatan untuk dipicu ketika status node adalah Timed Out, Error, atau Incomplete dan mengatur periode jangan ganggu untuk node tersebut dari |
Setelah konfigurasi selesai, klik OK untuk membuat aturan. Di halaman Rule Management, Anda dapat mengelola aturan dengan mengklik Details, Enable/Disable, atau Delete.
Details: Klik Details untuk melihat informasi dasar aturan.
Enable atau Disable: Mengaktifkan atau menonaktifkan aturan. Untuk memantau eksekusi tugas, aturan harus diaktifkan. Anda dapat melihat detail peringatan di panel Alert Information.
Delete: Klik Delete untuk menghapus aturan.
Ubah aturan pemantauan
Hanya owner aturan pemantauan, administrator tenant, atau akun root yang dapat mengubah aturan yang telah dibuat.
Praktik skenario: Kirim pesan peringatan ke grup DingTalk
Di grup DingTalk target untuk peringatan, klik ikon Group Settings di pojok kanan atas.
Klik Group Assistant.
Di halaman Group Assistant, klik Add Robot.
Di halaman Group Robot, klik
.Di halaman Select a robot to add, klik Custom.
Di kotak dialog Custom, klik Add.
Di kotak dialog Add Robot, atur parameter.
Parameter
Description
Robot Name
Nama robot kustom.
Add to Group
Kelompok tempat robot ditambahkan. Nilai ini tidak dapat diubah.
Custom Keywords
Setelah Anda menetapkan kata kunci, hanya pesan yang mengandung salah satu kata kunci tersebut yang akan dikirim. Anda harus menambahkan DataWorks sebagai salah satu kata kunci. Kata kunci bersifat case-sensitive.
CatatanAnda dapat menetapkan hingga 10 kata kunci. Sebuah pesan harus mengandung setidaknya satu kata kunci agar berhasil dikirim.
Pilih kotak centang I have read and agree to the "Custom Robot Service and Disclaimer", lalu klik Finish.
Setelah mengonfigurasi pengaturan keamanan, salin Webhook robot tersebut dan klik Finish.
PentingJaga kerahasiaan URL webhook. Jika URL tersebut bocor, hal ini menimbulkan risiko keamanan.
Buka halaman Rule Management dan klik Create Custom Rule. Di kotak dialog Create Custom Rule, atur parameter Alert Notification Method ke DingTalk Chatbot. Tempel Chatbot Webhook URL yang Anda salin dari DingTalk ke bidang Webhook URL di bagian DingTalk Chatbot.
FAQ
T: Bagaimana cara menghindari pemberitahuan peringatan yang terlalu sering?
J: Anda dapat mengonfigurasi kontrol kelelahan dengan mengatur jumlah maksimum peringatan, interval minimum antar-peringatan, dan periode jangan ganggu. Untuk informasi selengkapnya, lihat Konfigurasikan kontrol kelelahan.