全部產品
Search
文件中心

Cloud Monitor:通過日誌監控實現業務日誌的監控與警示

更新時間:Jun 19, 2024

本文檔介紹如何對儲存在Log Service(Log Service)中的資料進行統計和設定警示規則。

重要

僅2022年09月13日22:00:00之前已訂購訂用帳戶套餐(cms_edition)的使用者或已開通隨用隨付(cms_post)的使用者能使用日誌監控功能。日誌監控功能將於2024年09月14日下線,建議您使用企業CloudMonitor中的SLS日誌監控替代。

前提條件

請確保您已將本地日誌收集到Log Service中。更多資訊,請參見Log Service

背景資訊

業務日誌的監控和警示原理如下圖所示。業務日誌的統計監控與警示原理

操作步驟

  1. (可選)授權CloudMonitor訪問Log Service的許可權。

    當您首次使用日誌監控功能時,需要授權CloudMonitor訪問Log Service的許可權。

    1. 登入CloudMonitor控制台

    2. 在左側導覽列,單擊日誌監控

    3. CloudMonitor服務關聯角色對話方塊,單擊確定

  2. 建立日誌監控。

    1. 日誌監控頁面,單擊左上方的建立日誌監控

    2. 關聯資源頁面,選擇關聯資源,單擊下一步

    3. 監控項定義頁面,設定分析日誌,單擊下一步

      分析日誌相關參數的設定方法,如下表所示。

      參數

      描述

      監控項

      監控指標的名稱。

      單位

      監控項的單位。

      計算周期

      監控項的計算周期。單位:分鐘。取值:1、2、3、4、5、10、15、20、30、60。

      統計方法

      在計算周期內根據選定的統計方法對日誌資料進行彙總處理。如果欄位值是數值型,可以使用所有統計方法,否則只能使用計數countps兩種彙總演算法。取值:

      • 計數:計算統計周期內指定欄位數值的個數。

      • 求和:計算1分鐘內指定欄位數值之和。

      • 最大值:計算統計周期內指定欄位數值的最大值。

      • 最小值:計算統計周期內指定欄位數值的最小值。

      • 平均值:計算統計周期內指定欄位數值的平均值。

      • countps:計算統計周期內指定欄位求count後的每秒平均值。

      • sumps:計算統計周期內指定欄位求sum後的每秒平均值。

      • distinct:去重後計算統計周期內指定欄位出現的次數。

      擴充欄位

      為統計方法中的結果提供四則運算功能,例如:在統計方法中配置了HTTP狀態代碼請求總數TotalNumber和HTTP狀態代碼大於499的請求數5xxNumber,則可以通過擴充欄位計算出服務端的錯誤率:5xxNumber/TotalNumber*100。

      日誌篩選

      對日誌資料進行過濾,相當於SQL中的where條件,例如:Key為level,Value中需要監控的關鍵字為ERROR,該參數設定為level>=ERROR

      選擇過濾的日誌欄位名不能包含中文。

      Group-By

      對資料進行空間維度彙總,相當於SQL中的Group By。

      根據指定的維度,對監控資料進行分組。如果Group By不選擇任何維度,則根據彙總方法對全部監控資料進行彙總。

      關於Group By,請參見Group By子句

      Select SQL

      將統計方法轉化成SQL語句,方便您理解資料的處理方式。

      應用分組

      應用分組的名稱。將該監控項添加到指定應用分組中。

      監控項定義頁面,單擊預覽,預覽1分鐘的彙總日誌(只計算最近100條日誌資料),如下圖所示。預覽

    4. 警示設定頁面,設定警示規則相關參數,單擊下一步

    5. 建立結果頁面,單擊關閉

  3. 查看日誌監控資料。

    建立日誌監控後,等待3~5分鐘。在日誌監控頁面,單擊目標監控項對應操作列的監控圖表表徵圖,查看監控項的監控圖表。監控表徵圖

  4. 查看監控項的警示通知。

    當監控項達到警示條件時,您會收到警示通知。