全部產品
Search
文件中心

Cloud Monitor:建立警示規則和管理警示規則

更新時間:Jan 28, 2026

通過建立警示規則,您可以制定特定應用的警示。當警示規則被觸發時,系統會產生相應的警示事件,通過指定的通知方式向警示連絡人、機器人、自訂Webhook和行動整合預案等方式,發送警示資訊,以提醒您採取必要的解決措施。

前提條件

  • 根據不同的監控類型,請確保已建立需要警示的監控對象。

  • 已建立需要警示通知對象

建立警示規則

  1. 登入CloudMonitor2.0控制台,選擇左側導覽列所有功能 > 警示中心

  2. 警示中心頁面,選擇警示管理 > 警示規則

  3. 警示規則列表頁面,單擊建立警示規則

  4. 建立警示規則面板中,設定警示規則相關參數。

    1. 規則名稱:自訂警示規則名稱。

    2. 監控類型:根據需求選擇警示規則的監控類型。

      • 可觀測監控Prometheus版

        參數

        描述

        資料來源類型

        所屬目標監控類型的資料來源。

        地區

        資料來源的地區。

        Prometheus執行個體

        根據選擇目標執行個體設定警示規則。

        檢測條件定義方式

        自訂PromQL:根據您的需求可以自訂 PromQL查詢文法。請參見PromQL函數使用樣本

        基於預定義指標配置

        • 指標分組:選擇指標分組。

        • 指標:選擇指標。

        • 檢測條件:通過設定比較符和個數,設定檢測條件。

        • PromQL 預覽:預覽預定義的指標PromQL語句。

        嚴重等級

        設定警示規則嚴重等級。

        • P1: 緊急

        • P2: 錯誤

        • P3: 警告

        • P4: 普通

        期間

        設定警示的期間。

        警示檢測周期

        設定警示檢測周期的時間。

        資料完成後再檢測

        選擇檢測方式。

        內容

        使用Go template文法自訂警報資訊內容。例如:命名空間:{{$labels.namespace}} / Pod: {{$labels.pod_name}} / 容器:{{$labels.container}} CPU使用率{{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%, 當前值{{ printf "%.2f" $value }}%

      • 應用監控

        參數

        描述

        資料來源類型

        目標監控類型的資料來源類型。

        地區

        資料來源的地區。

        應用

        選擇設定警示規則的應用執行個體。

        指標分組

        選擇應用指標的分組。

        介面名稱

        選擇介面匹配方式,如:遍曆等於不等於正則匹配正則不匹配無維度

        介面調用類型

        檢測條件方式

        單條件

        • 設定最近 N 分鐘,調用類型和計算的方式,選擇比較符。

        • 設定不同層級的數量,緊急錯誤警告普通

        • PromQL 預覽:預覽預定義的指標PromQL語句。

        多條件

        • 多警示觸發規則:選擇觸發警示規則的條件方式,可以任意滿足條件或者同時滿足條件

        • 檢測條件1:可以參考以上單條件參數設定。

        • 添加檢測條件:可以根據需求添加多組的檢測條件。

        • 嚴重等級:根據需求選擇等級,包括了P1: 緊急P2: 錯誤P3: 警告P4: 普通

        警示檢測周期

        設定警示檢測周期的時間。

        檢測判定說明

        預覽自訂的檢測判定內容。

      • 使用者體驗監控

        參數

        描述

        資料來源類型

        目標監控類型的資料來源類型。

        地區

        資料來源的地區。

        應用

        選擇設定警示規則的應用執行個體。

        指標分組

        選擇應用指標分組,包含了異常監控卡頓監控資源監控頁面監控

        篩選條件

        根據選擇的指標分組,有不同的預定義參數,可以選擇匹配輸入值的方式,如:遍曆等於不等於包含不包含正則匹配正則不匹配無維度

        檢測條件方式

        可以參考以上應用監控

        警示檢測周期

        設定警示檢測周期的時間。

        檢測判定說明

        預覽自訂的檢測判定內容。

      • 大模型可觀測

        參數

        描述

        資料來源類型

        • Prometheus

        • 日誌

        地區

        資料來源的地區。

        應用

        選擇設定警示規則的應用執行個體。

        指標分組

        選擇應用指標分組,包含了異常監控卡頓監控資源監控頁面監控

        篩選條件

        根據選擇的指標分組,有不同的預定義參數,可以選擇匹配輸入值的方式,如:遍曆等於不等於包含不包含正則匹配正則不匹配無維度

        檢測條件方式

        可以參考以上應用監控

        警示檢測周期

        設定警示檢測周期的時間。

        檢測判定說明

        預覽自訂的檢測判定內容。

      • 基礎CloudMonitor

        參數

        描述

        產品

        根據需求選擇建立警示規則的目標雲產品。

        資源範圍

        設定選擇的雲產品資源範圍,包括全部資源應用分組執行個體

        指標類型

        根據您的需求設定警示規則的指標方式。

        • 簡單指標:根據需求設定監控指標,再為其設定閾值和警示層級,包括緊急、警告、普通,根據不同層級設定周期和閾值。

        • 組合指標:根據需求選擇不同警示層級,可以設定多個監控指標組合一起。

          • 多指標警示描述:可以添加多個不同的監控指標,並且設定閾值條件。

            說明

            如果設定了多個指標警示規則,則目標資源必須在每個指標上均有資料,只有在滿足條件後才能夠正常觸發警示。例如:在多指標警示規則中,如果包含公網的監控指標,而ECS主機資源並未配置公網IP,則將無法正常觸發警示。

          • 多指標關係:通過添加了多個不同條件的監控指標,可以設定邏輯運算子,如滿足所有條件時則警示或者有一個條件滿足時就警示。

        • 運算式:先選擇警示層級,再配置警示運算式警示閾值觸發次數

        無資料處理方法

        選擇無資料的處理方法。

        • 不做任何處理

        • 發送無資料警示

        • 視為恢複

      • 企業CloudMonitor:根據需求選擇自訂的指標倉庫,以下配置請參考本文檔的監控類型(可觀測監控Prometheus版)配置參數說明。

      • 雲撥測:請參考本文檔監控類型(可觀測監控Prometheus版)配置參數說明。

      • 容器洞察/ECS 洞察/RDS 洞察/AI Infra 服務洞察/Redis 洞察:請參考本文檔監控類型(可觀測監控Prometheus版)配置參數說明。

      • 日誌審計

        參數

        描述

        選擇模板

        Action Trail:根據需求選擇Action Trail模板。

        主機審計:根據需求選擇主機審計模板。

        查詢統計

        單查詢:通過設定日誌相關資訊單項查詢。

        集合操作:設定集合操作的方式,可以添加多組資源。

        檢測判定

        根據需求可以添加多組條件,設定匹配資料的方式和嚴重等級。

        嚴重等級

        根據需求選擇警示層級,包括緊急錯誤警告普通

        連續次數

        設定連續滿足條件多少次,觸發警示。

        警示檢測周期

        自訂設定警示檢測的周期是多少時間。

      • Log Service:請參考本文檔監控類型(日誌審計)配置參數說明。

    3. 設定警報資訊

      1. 內容:根據您的需求可以自訂警報資訊。

      2. 標籤註解:設定警示規則的標籤和註解。包括標籤名稱和標籤值。

    4. 設定警示通知

      1. 通知對象:根據您的需求,可以選擇一個或者多個通知對象方式,如:連絡人/聯絡組/DingTalk/企業微信/飛書/Slack/自訂Webhook,觸發警示後接收警示資訊。

      2. 整合到 ARMS 警示管理:根據需求選擇是或者否。

        說明

        警示事件預設會發送到 ARMS 警示營運中心,如需設定警示通知,請前往 ARMS 警示營運中心進行配置。

      3. 行動整合:選擇特定的雲產品或者第三方服務,處理警示後續的事務,如:Log Service、輕量訊息佇列、Function Compute和第三方服務pagerDuty、Webhook。

      4. 通道沉默周期:警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:1、5、10、15、30、50分鐘,1、3、6、12、24小時。

        說明

        例如:當通道沉默周期選擇12小時時,如果警示未恢複正常,則間隔12小時後,CloudMonitor會再次發送警示通知。

      5. 生效時間:警示規則的生效時間。警示規則僅在生效期內才會發送警示通知。

        說明
        • 當警示規則不在生效期時,不會發送警示通知,但是警示記錄仍然會顯示在警示歷史列表中。

        • 通知時間支援24小時內,可跨天,例如23:00 至 第二天01:00

管理警示規則

警示規則列表頁面,您可以查詢警示歷史、編輯或刪除警示規則:

  • 搜尋:可以根據警示規則分類篩選警示規則列表,或者通過如下警示參數,搜尋目標警示規則。

    • 監控類型

    • 規則名稱

    • 規則ID

    • 警示狀態

    • 啟停狀態

  • 更多篩選:單擊右側更多篩選,可以使用添加標籤添加通知對象方式搜尋。

  • 編輯:選擇目標警示規則,單擊右側操作列中的編輯,在對話方塊中修改資訊,單擊確定

  • 刪除:選擇目標警示規則,單擊右側操作列中的表徵圖image刪除