全部產品
Search
文件中心

ApsaraMQ for RocketMQ:監控警示

更新時間:Mar 20, 2025

ApsaraMQ for RocketMQGlobal Replicator支援對資料同步任務的流入、流出和處理量等指標進行統計。此外,系統支援監控指標的CloudMonitor警示配置,當指標達到警示閾值時,將向警示接收人發出相應的警示通知。

背景資訊

ApsaraMQ for RocketMQGlobal Replicator功能的同步通道依賴事件匯流排EventBridge來實現。建立Global Replicator任務後,在添加Topic映射和開啟消費進度同步功能的同時也會在相應地區下事件匯流排EventBridge建立對應事件流。

建立成功的事件流支援查看多種詳細的指標資訊,包括事件流出、事件流入、事件流下遊回應時間和單位時間內處理的事件數目量的指標。若想監控目標事件流的各個指標,可以設定警示規則,當事件流的監控指標達到警示條件,會自動發送警示通知。

查看監控指標

  1. 登入事件匯流排EventBridge控制台,在左側導覽列,單擊事件流
  2. 在頂部功能表列,選擇目標地區,然後在事件流頁面,單擊目標事件流名稱。

  3. 進入目標事件流的概覽頁面,在左側導覽列,單擊指標監控

  4. 指標監控頁面,您可以查看以下指標資料的監控情況。

    • 流入/流出:

      • 事件流入(count):表示單位時間內進入事件流的事件數目量。

      • 事件流出(count):表示單位時間內從事件流出的事件數目量。

        • 流出成功:表示事件成功傳遞到下遊系統的數量。

        • 流出失敗:表示事件未能成功傳遞到下遊系統的數量。

      • 事件流下遊回應時間:衡量事件被發送到下遊目標後,下遊目標響應所需的時間。

    • 處理量:

      • 處理量(count):表示單位時間內處理的事件數目量。瞬時處理量通常用于衡量系統的即時處理能力。

        • 過濾成功:表示根據規則過濾條件成功匹配到的事件數目量。

        • 過濾失敗:表示根據規則過濾條件匹配失敗的事件梳理。

    6vrdx1M426

    說明
    • 控制台預設查詢1小時之內的指標資料,您可以在頁面頂部選擇需要查詢的時間段。

    • 您可以通過單擊每個指標地區的kI7zZLyC0r表徵圖來放大並查看相應的指標監控資料。

建立警示規則

  1. 登入事件匯流排EventBridge控制台,在左側導覽列,單擊事件流
  2. 在頂部功能表列,選擇目標地區,然後在事件流頁面,單擊目標事件流名稱。

  3. 進入目標事件流的概覽頁面,在左側導覽列,單擊指標監控

  4. 指標監控頁面,單擊右上方的6QqnsJIbtT表徵圖,單擊設定警示規則,即可跳轉至CloudMonitor控制台的警示規則頁面,然後單擊建立警示規則

  5. 建立警示規則面板,配置以下資訊,然後單擊確認

    配置項

    樣本

    說明

    產品

    事件匯流排 - EventStreaming

    在下拉式清單中選擇事件匯流排 - EventStreaming

    資源範圍

    全部資源

    選擇全部資源

    規則描述

    • 規則名稱:demo

    • 指標類型:簡單指標

    • 監控指標:事件流流入事件量

    • 警示層級:警告(Warn)

    • 閾值:1000 count

    1. 單擊添加規則,在下拉式功能表中選擇合適的指標類型。

    2. 設定規則描述面板,先輸入規則名稱,再設定規則條件。

      • 簡單指標:先選擇監控指標,再為其設定閾值和警示層級。

      • 組合指標:先選擇警示層級,再配置多指標警示描述

        說明

        如果您配置了多條警示規則,需要選擇多指標關係。具體如下:

        • 當所有指標都合格時候則警示:當所有配置的警示規則都滿足後,才會觸發警示。

        • 有一個滿足條件就警示:當滿足所有配置的警示規則中的任何一條,則直接觸發警示。

      • 運算式:先選擇警示層級,再配置警示運算式。

      • 智能閾值:關於智能閾值的更多資訊,請參見概覽建立智能閾值警示規則

    3. 單擊確定

    說明

    關於如何設定複雜的運算式警示條件,請參見警示規則運算式說明

    通道沉默周期

    15分鐘

    警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:1分鐘、5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。

    某監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。

    生效時間

    • 開始時間:00:00

    • 結束時間:23:59

    • 周期:周一至周日

    警示規則的生效時間。警示規則僅在生效期內才會發送警示通知。

    說明

    當警示規則不在生效期時,不會發送警示通知,但是警示記錄仍然會顯示在警示歷史列表中。

    標籤

    • 標籤鍵:key

    • 標籤值:value

    警示規則的標籤。包括標籤名稱和標籤值。

    說明

    您最多可設定6組標籤。

    警示連絡人群組

    test

    發送警示的連絡人群組。

    應用分組的警示通知會發送給該警示連絡人群組中的警示連絡人。警示連絡人群組是一組警示連絡人,可以包含一個或多個警示連絡人。

    關於如何建立警示連絡人和警示連絡人群組,請參見建立警示連絡人或警示連絡人群組

    警示回調

    http://alert.aliyun.com:8080/callback

    公網可訪問的URL,用於接收CloudMonitor通過POST請求推送的警示資訊。目前僅支援HTTP協議。關於如何設定警示回調,請參見使用閾值警示回調

    當您需要測試警示回調地址的連通性時,可以執行以下操作。

    1. 單擊回調地址正後方的測試

      WebHook測試面板,您可以通過Webhook返回的狀態代碼和測試結果詳情對警示回調地址的連通性進行判斷和排查。

      說明

      您還可以設定Webhook的回調模板類型語言,再次單擊測試,擷取對應的測試結果詳情。

    2. 單擊關閉

    說明

    單擊進階設定,可設定該參數。

    推送渠道

    彈性策略

    支援以下四個推送渠道,請按需開啟相應開關並進行配置:

    • Auto Scaling:如果您開啟Auto Scaling開關,當警示發生時,會觸發相應的伸縮規則。建立Auto Scaling組和Auto Scaling規則,請參見配置伸縮組配置伸縮規則

    • Log Service:如果您開啟Log Service開關,當警示發生時,會將警示資訊發送至Log Service的日誌庫。建立Project和Logstore,請參見快速入門

    • 輕量訊息佇列(原 MNS):如果您開啟輕量訊息佇列(原 MNS)開關,當警示發生時,會將警示資訊發送至Message Service的主題。建立主題,請參見建立主題

    • Function Compute:如果您開啟Function Compute開關,當警示發生時,會將警示通知發送至Function Compute進行格式處理。建立服務和函數,請參見快速建立函數

    無資料處理方法

    不做任何處理

    無監控資料時警示的處理方式。取值:

    • 不做任何處理(預設值)

    • 發送無資料警示

    • 視為恢複

    說明

    單擊進階設定,可設定該參數。