全部產品
Search
文件中心

Cloud Monitor:管理日誌監控項

更新時間:Jun 19, 2024

您可以在日誌監控中建立監控項及其警示規則,並對該監控項執行修改和刪除操作。

前提條件

  • 請確保您已在Log ServiceSLS中建立Project和Logstore。

    具體操作,請參見快速入門

  • 請確保您已授權CloudMonitor訪問Log ServiceSLS的許可權。

    具體操作,請參見授權日誌監控

建立日誌監控項

重要

CloudMonitor已於2022年09月13日停止日誌監控、自訂監控和自訂事件監控服務。2022年09月13日前正在使用上述三個服務的使用者仍然可以在2024年09月13日前正常使用。 其他使用者如有相關產品需求,建議使用企業CloudMonitor下業務監控中的本地日誌監控、SLS日誌監控及自訂監控服務,功能更靈活,價格更低。 更多資訊,請參見管理本地日誌的資料接入任務管理SLS日誌的監控指標上報自訂監控資料

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇接入中心 > 日誌監控

  3. 日誌監控頁面,單擊建立日誌監控

  4. 關聯資源頁面,設定Log Service相關參數,單擊下一步

    參數

    描述

    地區

    Log Service中記錄項目(日誌Project)所在地區。

    日誌Project

    Log Service中記錄項目的名稱。

    日誌Logstore

    Log Service中日誌庫的名稱。

  5. 監控項定義頁面,設定監控項相關參數,單擊下一步

    參數

    描述

    監控項

    監控指標的名稱。

    單位

    監控項的單位。

    計算周期

    監控項的計算周期。單位:分鐘。取值:1、2、3、4、5、10、15、20、30、60。

    統計方法

    在計算周期內根據選定的統計方法對日誌資料進行彙總處理。如果欄位值是數值型,可以使用所有統計方法,否則只能使用計數countps兩種彙總演算法。取值:

    • 計數:計算統計周期內指定欄位數值的個數。

    • 求和:計算1分鐘內指定欄位數值之和。

    • 最大值:計算統計周期內指定欄位數值的最大值。

    • 最小值:計算統計周期內指定欄位數值的最小值。

    • 平均值:計算統計周期內指定欄位數值的平均值。

    • countps:計算統計周期內指定欄位求count後的每秒平均值。

    • sumps:計算統計周期內指定欄位求sum後的每秒平均值。

    • distinct:去重後計算統計周期內指定欄位出現的次數。

    擴充欄位

    為統計方法中的結果提供四則運算功能,例如:在統計方法中配置了HTTP狀態代碼請求總數TotalNumber和HTTP狀態代碼大於499的請求數5xxNumber,則可以通過擴充欄位計算出服務端的錯誤率:5xxNumber/TotalNumber*100。

    日誌篩選

    對日誌資料進行過濾,相當於SQL中的where條件,例如:Key為level,Value中需要監控的關鍵字為ERROR,該參數設定為level>=ERROR

    選擇過濾的日誌欄位名不能包含中文。

    Group-By

    對資料進行空間維度彙總,相當於SQL中的Group By。

    根據指定的維度,對監控資料進行分組。如果Group By不選擇任何維度,則根據彙總方法對全部監控資料進行彙總。

    關於Group By,請參見Group By子句

    Select SQL

    將統計方法轉化成SQL語句,方便您理解資料的處理方式。

    應用分組

    應用分組的名稱。將該監控項添加到指定應用分組中。

  6. 警示設定頁面,設定警示規則相關參數,單擊下一步

    參數

    描述

    規則名稱

    警示規則的名稱。

    規則描述

    警示規則的主體。當監控資料滿足指定警示條件時,觸發警示規則。

    警示層級

    警示通知方式。取值:

    郵件+WebHook

    連續幾次超過閾值後警示

    連續幾次超過閾值後,警示連絡人群組中的連絡人會收到警示通知。取值:1、3、5、10、15、30、60、90、120、180。

    通道沉默周期

    警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時、24小時。

    監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。

    生效時間

    警示規則的生效時間,警示規則只在生效時間內才會檢查監控資料是否需要警示。

    警示回調

    填寫公網可訪問的URL地址,CloudMonitor會將警示資訊通過POST或GET請求推送到該URL地址,目前僅支援HTTP協議。關於警示回調的設定方法,請參見使用閾值警示回調

  7. 建立結果頁面,單擊關閉

修改日誌監控項

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇接入中心 > 日誌監控

  3. 日誌監控頁面,單擊目標監控項對應操作列的編輯

  4. 關聯資源頁面,設定監控項相關參數,單擊下一步

    參數

    描述

    地區

    Log Service中記錄項目(日誌Project)所在地區。

    日誌Project

    Log Service中記錄項目的名稱。

    日誌Logstore

    Log Service中日誌庫的名稱。

  5. 監控項定義頁面,設定監控項相關參數,單擊下一步

    參數

    描述

    單位

    監控項的單位。

    計算周期

    監控項的計算周期。單位:分鐘。取值:1、2、3、4、5、10、15、20、30、60。

    統計方法

    在計算周期內根據選定的統計方法對日誌資料進行彙總處理。如果欄位值是數值型,可以使用所有統計方法,否則只能使用計數countps兩種彙總演算法。取值:

    • 計數:計算統計周期內指定欄位數值的個數。

    • 求和:計算1分鐘內指定欄位數值之和。

    • 最大值:計算統計周期內指定欄位數值的最大值。

    • 最小值:計算統計周期內指定欄位數值的最小值。

    • 平均值:計算統計周期內指定欄位數值的平均值。

    • countps:計算統計周期內指定欄位求count後的每秒平均值。

    • sumps:計算統計周期內指定欄位求sum後的每秒平均值。

    • distinct:去重後計算統計周期內指定欄位出現的次數。

    擴充欄位

    為統計方法中的結果提供四則運算功能,例如:在統計方法中配置了HTTP狀態代碼請求總數TotalNumber和HTTP狀態代碼大於499的請求數5xxNumber,則可以通過擴充欄位計算出服務端的錯誤率:5xxNumber/TotalNumber*100。

    日誌篩選

    對日誌資料進行過濾,相當於SQL中的where條件,例如:Key為level,Value中需要監控的關鍵字為ERROR,該參數設定為level>=ERROR

    選擇過濾的日誌欄位名不能包含中文。

    Group-By

    對資料進行空間維度彙總,相當於SQL中的Group By。

    根據指定的維度,對監控資料進行分組。如果Group By不選擇任何維度,則根據彙總方法對全部監控資料進行彙總。

    關於Group By,請參見Group By子句

    Select SQL

    將統計方法轉化成SQL語句,方便您理解資料的處理方式。

    應用分組

    應用分組的名稱。將該監控項添加到指定應用分組中。

  6. 警示設定頁面,設定警示規則相關參數,單擊下一步

    參數

    描述

    規則名稱

    警示規則的名稱。

    規則描述

    警示規則的主體。當監控資料滿足指定警示條件時,觸發警示規則。

    警示層級

    警示通知方式。取值:

    郵件+WebHook

    連續幾次超過閾值後警示

    連續幾次超過閾值後,警示連絡人群組中的連絡人會收到警示通知。取值:1、3、5、10、15、30、60、90、120、180。

    通道沉默周期

    警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時、24小時。

    監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。

    生效時間

    警示規則的生效時間,警示規則只在生效時間內才會檢查監控資料是否需要警示。

    警示回調

    填寫公網可訪問的URL地址,CloudMonitor會將警示資訊通過POST或GET請求推送到該URL地址,目前僅支援HTTP協議。關於警示回調的設定方法,請參見使用閾值警示回調

  7. 建立結果頁面,單擊關閉

刪除日誌監控項

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇接入中心 > 日誌監控

  3. 刪除日誌監控項。

    • 單個刪除

      1. 先單擊目標監控項對應操作列的image.png表徵圖,然後單擊刪除

      2. 確認刪除日誌監控對話方塊,單擊確定

    • 大量刪除

      1. 先單擊目標監控項前面的複選框,然後單擊左下角的大量刪除

      2. 確認刪除日誌監控對話方塊,單擊確定