通過建立警示規則,您可以制定特定應用的警示。當警示規則被觸發時,系統會產生相應的警示事件,通過指定的通知方式向警示連絡人、機器人、自訂Webhook和行動整合預案等方式,發送警示資訊,以提醒您採取必要的解決措施。
前提條件
根據不同的監控類型,請確保已建立需要警示的監控對象。
已建立需要警示通知對象。
建立警示規則
登入CloudMonitor2.0控制台,選擇左側導覽列。
在警示中心頁面,選擇。
在警示規則列表頁面,單擊建立警示規則。
在建立警示規則面板中,設定警示規則相關參數。
規則名稱:自訂警示規則名稱。
監控類型:根據需求選擇警示規則的監控類型。
可觀測監控Prometheus版
參數
描述
資料來源類型
所屬目標監控類型的資料來源。
地區
資料來源的地區。
Prometheus執行個體
根據選擇目標執行個體設定警示規則。
檢測條件定義方式
自訂PromQL:根據您的需求可以自訂 PromQL查詢文法。請參見PromQL函數使用樣本。
基於預定義指標配置:
指標分組:選擇指標分組。
指標:選擇指標。
檢測條件:通過設定比較符和個數,設定檢測條件。
PromQL 預覽:預覽預定義的指標PromQL語句。
嚴重等級
設定警示規則嚴重等級。
P1: 緊急
P2: 錯誤
P3: 警告
P4: 普通
期間
設定警示的期間。
警示檢測周期
設定警示檢測周期的時間。
資料完成後再檢測
選擇檢測方式。
內容
使用Go template文法自訂警報資訊內容。例如:命名空間:{{$labels.namespace}} / Pod: {{$labels.pod_name}} / 容器:{{$labels.container}} CPU使用率{{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%, 當前值{{ printf "%.2f" $value }}%
應用監控
參數
描述
資料來源類型
目標監控類型的資料來源類型。
地區
資料來源的地區。
應用
選擇設定警示規則的應用執行個體。
指標分組
選擇應用指標的分組。
介面名稱
選擇介面匹配方式,如:遍曆、等於、不等於、正則匹配、正則不匹配、無維度。
介面調用類型
檢測條件方式
單條件:
設定最近
N分鐘,調用類型和計算的方式,選擇比較符。設定不同層級的數量,緊急、錯誤、警告、普通。
PromQL 預覽:預覽預定義的指標PromQL語句。
多條件:
多警示觸發規則:選擇觸發警示規則的條件方式,可以任意滿足條件或者同時滿足條件。
檢測條件1:可以參考以上單條件參數設定。
添加檢測條件:可以根據需求添加多組的檢測條件。
嚴重等級:根據需求選擇等級,包括了P1: 緊急、P2: 錯誤、P3: 警告、P4: 普通。
警示檢測周期
設定警示檢測周期的時間。
檢測判定說明
預覽自訂的檢測判定內容。
使用者體驗監控
參數
描述
資料來源類型
目標監控類型的資料來源類型。
地區
資料來源的地區。
應用
選擇設定警示規則的應用執行個體。
指標分組
選擇應用指標分組,包含了異常監控、卡頓監控、資源監控、頁面監控。
篩選條件
根據選擇的指標分組,有不同的預定義參數,可以選擇匹配輸入值的方式,如:遍曆、等於、不等於、包含、不包含、正則匹配、正則不匹配、無維度。
檢測條件方式
可以參考以上應用監控。
警示檢測周期
設定警示檢測周期的時間。
檢測判定說明
預覽自訂的檢測判定內容。
大模型可觀測
參數
描述
資料來源類型
Prometheus
日誌
地區
資料來源的地區。
應用
選擇設定警示規則的應用執行個體。
指標分組
選擇應用指標分組,包含了異常監控、卡頓監控、資源監控、頁面監控。
篩選條件
根據選擇的指標分組,有不同的預定義參數,可以選擇匹配輸入值的方式,如:遍曆、等於、不等於、包含、不包含、正則匹配、正則不匹配、無維度。
檢測條件方式
可以參考以上應用監控。
警示檢測周期
設定警示檢測周期的時間。
檢測判定說明
預覽自訂的檢測判定內容。
基礎CloudMonitor
參數
描述
產品
根據需求選擇建立警示規則的目標雲產品。
資源範圍
設定選擇的雲產品資源範圍,包括全部資源、應用分組、執行個體。
指標類型
根據您的需求設定警示規則的指標方式。
簡單指標:根據需求設定監控指標,再為其設定閾值和警示層級,包括緊急、警告、普通,根據不同層級設定周期和閾值。
組合指標:根據需求選擇不同警示層級,可以設定多個監控指標組合一起。
多指標警示描述:可以添加多個不同的監控指標,並且設定閾值條件。
說明如果設定了多個指標警示規則,則目標資源必須在每個指標上均有資料,只有在滿足條件後才能夠正常觸發警示。例如:在多指標警示規則中,如果包含公網的監控指標,而ECS主機資源並未配置公網IP,則將無法正常觸發警示。
多指標關係:通過添加了多個不同條件的監控指標,可以設定邏輯運算子,如滿足所有條件時則警示或者有一個條件滿足時就警示。
運算式:先選擇警示層級,再配置警示運算式和警示閾值觸發次數。
無資料處理方法
選擇無資料的處理方法。
不做任何處理
發送無資料警示
視為恢複
企業CloudMonitor:根據需求選擇自訂的指標倉庫,以下配置請參考本文檔的監控類型(可觀測監控Prometheus版)配置參數說明。
雲撥測:請參考本文檔監控類型(可觀測監控Prometheus版)配置參數說明。
容器洞察/ECS 洞察/RDS 洞察/AI Infra 服務洞察/Redis 洞察:請參考本文檔監控類型(可觀測監控Prometheus版)配置參數說明。
日誌審計
參數
描述
選擇模板
Action Trail:根據需求選擇Action Trail模板。
主機審計:根據需求選擇主機審計模板。
查詢統計
單查詢:通過設定日誌相關資訊單項查詢。
集合操作:設定集合操作的方式,可以添加多組資源。
檢測判定
根據需求可以添加多組條件,設定匹配資料的方式和嚴重等級。
嚴重等級
根據需求選擇警示層級,包括緊急、錯誤、警告、普通。
連續次數
設定連續滿足條件多少次,觸發警示。
警示檢測周期
自訂設定警示檢測的周期是多少時間。
Log Service:請參考本文檔監控類型(日誌審計)配置參數說明。
設定警報資訊。
內容:根據您的需求可以自訂警報資訊。
標籤和註解:設定警示規則的標籤和註解。包括標籤名稱和標籤值。
設定警示通知。
通知對象:根據您的需求,可以選擇一個或者多個通知對象方式,如:連絡人/聯絡組/DingTalk/企業微信/飛書/Slack/自訂Webhook,觸發警示後接收警示資訊。
整合到 ARMS 警示管理:根據需求選擇是或者否。
說明警示事件預設會發送到 ARMS 警示營運中心,如需設定警示通知,請前往 ARMS 警示營運中心進行配置。
行動整合:選擇特定的雲產品或者第三方服務,處理警示後續的事務,如:Log Service、輕量訊息佇列、Function Compute和第三方服務pagerDuty、Webhook。
通道沉默周期:警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:1、5、10、15、30、50分鐘,1、3、6、12、24小時。
說明例如:當通道沉默周期選擇12小時時,如果警示未恢複正常,則間隔12小時後,CloudMonitor會再次發送警示通知。
生效時間:警示規則的生效時間。警示規則僅在生效期內才會發送警示通知。
說明當警示規則不在生效期時,不會發送警示通知,但是警示記錄仍然會顯示在警示歷史列表中。
通知時間支援24小時內,可跨天,例如23:00 至 第二天01:00
管理警示規則
在警示規則列表頁面,您可以查詢警示歷史、編輯或刪除警示規則:
搜尋:可以根據警示規則分類篩選警示規則列表,或者通過如下警示參數,搜尋目標警示規則。
監控類型
規則名稱
規則ID
警示狀態
啟停狀態
更多篩選:單擊右側更多篩選,可以使用添加標籤和添加通知對象方式搜尋。
編輯:選擇目標警示規則,單擊右側操作列中的編輯,在對話方塊中修改資訊,單擊確定。
刪除:選擇目標警示規則,單擊右側操作列中的表徵圖
刪除。