全部產品
Search
文件中心

Microservices Engine:如何配置監控警示

更新時間:Apr 24, 2025

阿里雲任務調度XXL-JOB版支援任務維度、執行個體和應用叢集維度監控警示配置。在任務運行時,通過指定監控警示配置,可以協助您及時瞭解任務的執行情況,及時發現和處理問題。

任務維度監控警示配置

操作步驟

登入XXL-JOB控制台,並在頂部功能表列選擇地區。單擊指定XXL-JOB執行個體,在左側導覽列,選擇任務管理,單擊指定任務操作列的編輯。在通知配置介面配置對應任務層級監控警示資訊。

image

通知配置參數說明如下:

配置項

描述

預設值

逾時警示

任務執行逾時是否發送警示。

開啟

逾時時間

任務執行逾時的時間,任務執行超過設定值,上報逾時警示。

7200秒

逾時終止

任務執行超過指定時間是否自動停止,防止把下一次調度卡住。

關閉

成功通知

任務執行成功是否通知給連絡人。對於層級比較重要的任務,建議設定運行成功後通知連絡人。

關閉

失敗警示

任務執行失敗是否警示。

開啟

連續失敗次數

任務連續失敗指定次數才警示。

1

無可用機器警示

任務調度的時候沒有可用執行器是否警示。

開啟

通知方式

上報成功通知時,逾時通知的方式。目前支援簡訊、Webhook、郵件和電話。

重要

如果配置項通知方式包含webhook方式,則需要額外配置以下內容。

  1. 如果選用webhook警示(DingTalk/企業微信/飛書),需要通過公網外發,需要您的VPC網路綁定公網NAT Gateway,如下圖:

    image

  2. 如Webhook有安全限制,則需在對應的Webhook機器人上配置訊息內容白名單。例如:DingTalk機器人增加關鍵字SchedulerX(區分大小寫),否則無法收到警示資訊。

通知對象

整合CloudMonitor連絡人,需要去CloudMonitor配置連絡人並啟用連絡方式。

執行個體和應用維度監控警示配置

基於任務調度統計資訊,支援使用者在CloudMonitor配置該執行個體下任務調度資訊警示,常見情境如下:

  • 執行個體維度:某執行個體下所有任務,調度下跌30%警示。

  • 應用維度:某執行個體下的某個應用,連續3分鐘失敗超過5次警示。

操作步驟

  1. 登入XXL-JOB控制台,並在頂部功能表列選擇地區。單擊進入指定XXL-JOB執行個體,在左側導覽列,選擇基礎資訊菜單。

  2. 在調度統計大盤裡,單擊右上方image下的設定警示規則,或者單擊image表徵圖,進入CloudMonitor警示規則設定。

    b7cf82a93b53c9c0d5f89246cdb038cf

  3. 單擊建立警示規則,選擇產品為分布式任務調度,單擊添加執行個體選擇指定執行個體,並配置警示規則。

    重要

    沉默周期:表示警示發送一次後會屏蔽指定時間周期內該警示資訊的再次發送。

    image

  4. 單擊添加規則,支援選擇監控指標。監控指標分為執行個體層級應用層級兩個維度,您可以根據需要選擇配置。

    • 執行個體層級:相應的指標監控統計的是該執行個體下所有任務觸發執行情況。

      image

    • 應用層級:需選擇執行個體中對應的應用,相應的監控指標統計該執行個體下指定應用的任務觸發執行情況。

      • 如果該應用對應的指標還沒有上報過,則appName下拉框無法自動選擇,可以手動輸入。

      • 如果appName為空白,則表示所有應用都預設按照該規則警示。

      image

  5. 添加警示連絡人群組,單擊確認即可完成監控警示配置。

    image