MSE提供應用監控警示功能,可在滿足警示條件時通過郵件、簡訊、DingTalk等渠道即時警示,協助您主動發現異常。本文介紹如何建立和管理警示規則。
前提條件
背景資訊
警示控制項本質是資料集的資料展示方式,所以在建立警示控制項的同時,會建立一個資料集來儲存警示控制項的底層資料。
建立警示大約在10分鐘內生效,警示判斷會存在1分鐘~3分鐘的延時。
建立警示規則
登入MSE註冊配置中心管理主控台,並在頂部功能表列選擇地區。
在左側導覽列,選擇注册配置中心 > 告警管理 > 警示規則管理。
在MSE告警列表頁面,單擊建立MSE告警规则。
在建立MSE告警规则頁面,配置警示相關配置項,然後單擊儲存。
配置項
描述
警示名稱
填寫警示規則名稱。
MSE執行個體
選擇叢集。叢集名稱後的
()裡顯示該叢集的註冊配置中心類型,目前僅支援Nacos和ZooKeeper。警示分組
選擇警示指標的分組。
警示指標
選擇警示指標。不同警示分組所支援的警示指標也不同,請根據實際需求選擇。
警示條件
設定觸發警示的條件。例如,當服務數大於100時,發送警示。
篩選條件
預設無篩選,無需設定。
期間
設定期間。
警示等級
設定警示的等級。警示嚴重程度從預設、P4、P3、P2、P1逐級上升。
警示內容
設定觸發該警示時,所顯示的警示內容。您可以使用Go template文法在警示內容中自訂警示參數變數,例如:
警示叢集的ID:{{$label.service_cluster_id}} 警示的叢集節點:{{$label.kubernetes_pod_name}} 設定的閾值:{{$labels.metrics_params_value}} 觸發警示的實際值:{{ printf "%.2f" $value }}同時,警示內容也會根據警示指標自動調整。
警示通知
選擇警示通知並進行相應的配置。可以選擇極簡模式或普通模式。
快速指定通知策略
選擇警示通知為普通模式時需要配置此項。
當警示觸發時,ARMS警示中心會根據配置的通知策略對產生的警示事件進行指派、處理並發送通知。
您可以單擊建立通知策略進行快速建立,也可以先在通知策略頁面建立自訂通知策略,然後在這裡選擇已建立的通知策略。具體操作,請參見通知策略。
進階設定
警示檢查周期
設定警示檢查周期,預設值為1(單位:分鐘)。
資料完整後再檢查
選擇是否在資料完整後再檢查。
標籤
單擊建立標籤,設定警示規則的標籤,設定的標籤可用作指派規則的選項。
注釋
單擊建立注釋,設定鍵為message,設定值為{{變數名}}警示資訊。設定完成後的格式為:
message:{{$labels.pod_name}}重啟警示資訊,例如message:{{$labels.pod_name}}重啟。
後續操作
您在監控中建立的警示規則均會顯示在MSE告警列表頁面。
在MSE告警列表頁面,您可以在操作列中按需對目標警示規則採取以下操作。
如需編輯警示規則,請單擊編輯,並在編輯MSE告警规则頁面中修改警示規則,然後單擊完成。
如需啟用或停止警示規則,請單擊啟動或停止,並在提示對話方塊中,單擊確認。
如需刪除警示規則,請單擊刪除,並在提示對話方塊中單擊確認。
如需查看警示歷史,請單擊警示事件歷史,在事件列表頁面中查看到歷史警示資訊。
可選:如果您想要批量管理多條警示規則,可選中多條警示規則,後按需單擊大量操作 > 大量啟動警示規則/大量停止警示規則/大量刪除警示規則/大量設定標籤,並在對話方塊單擊確認。