ApsaraDB for MongoDB產品已接入CloudMonitor平台,通過訂閱重要的系統事件和設定警示規則,協助您即時掌握事件動態和運行情況。
背景資訊
CloudMonitor(CloudMonitor)是針對阿里雲資源和互連網應用提供監控的服務。CloudMonitor的警示服務為您提供以下兩種警示通知能力,當阿里雲產品發生系統異常時,您可以及時知曉發生的事件,並自動處理例外狀況事件(例如雲產品故障)。
訂閱事件:通過郵件、DingTalk機器人的方式,將事件通知直接觸達指定人員,以便快速響應。
設定警示:將警示分發到您的輕量訊息佇列、Function Compute、URL回調和Log Service中,以便根據業務情境自動化處理異常警示。
操作步驟
訂閱事件
以訂閱ApsaraDB for MongoDB的系統事件執行個體故障開始為例,為您介紹訂閱事件的完整操作流程。
在左側導覽列,選擇。
在訂閱策略頁簽,單擊建立訂閱策略。
在建立訂閱策略頁面,設定訂閱策略的相關參數。
基本資料:輸入訂閱策略名稱稱。
警示訂閱:
訂閱類型選擇系統事件。
訂閱範圍中的產品選擇ApsaraDB for MongoDB、事件類型選擇異常、事件名稱選擇執行個體故障開始、事件等級選擇嚴重(Critical),應用分組、事件內容和事件資源均不設定,表示訂閱本帳號內所有應用分組中的所有ApsaraDB for MongoDB執行個體的系統事件執行個體故障開始。
說明關於ApsaraDB for MongoDB支援的系統事件,請參見CloudMonitor事件列表。
合并降噪:使用預設值。
通知:建立通知配置,自訂通知方式使用預設通知方式。
建立通知配置時,先輸入通知配置名稱,再選擇通知設定為直接設定通知群組,然後選擇警示聯絡組,最後單擊確定。
說明關於如何建立通知配置,請參見管理通知配置。
系統自動根據警示組中警示連絡人的通知方式發送警示通知,例如:警示連絡人中設定了手機號碼和郵箱,自訂通知方式使用預設通知方式,則警示連絡人只會收到警示電話、簡訊和郵件。
推送與整合:無需配置。
說明關於如何建立推送渠道,請參見管理推送渠道。
表 1. 訂閱策略參數說明
地區
參數
說明
基本資料
名稱
訂閱策略的名稱。
描述
訂閱策略的描述資訊。
警示訂閱
訂閱類型
警示訂閱的類型。取值:
系統事件:系統事件彙集了各類雲產品的故障和營運事件。通過訂閱系統事件,您可以在事件發生時及時收到通知或觸發外部系統。您需要設定系統事件的訂閱範圍,包括:產品、事件類型、事件名稱、事件等級、應用分組、事件內容和事件資源。
事件內容:是指事件詳情內Content內的欄位, 輸入框會對關鍵字進行包含匹配,如需輸入多個關鍵字通過,進行分割。在白名單模式下,多個關鍵字滿足一個即可匹配;在黑名單模式下,多個關鍵字需要全部都匹配。例如在白名單時,事件內容輸入框輸入:re,1754xxxxx651403,代表存在re或者1754xxxxx651403欄位的所有事件都會被過濾出來。
"content": {"invokeId": "t-bj05sxXXXXXXa5xq8","repeats": 1,"finishTime": "2025-08-05T17:07:17Z","commandName": "cmd-2025-08-06","instanceId": "i-2ze61xxxxxugk0zoh7","repeatMode": "Once","playerUid": 1754xxxxx651403,"exitCode": 0,"startTime": "2025-08-05T17:07:14Z","ownerId": 18250xxxxx44564,"commandId": "c-bj05sxxxxxxog00","invocationStatus": "Success"}事件資源:是雲產品對應的ResourceId,例如:
acs:ecs:cn-shanghai:{uid}:instance/{instanceId}。 輸入框會對關鍵字進行包含匹配,如需輸入多個關鍵字通過,進行分割。在白名單模式下,多個關鍵字滿足一個即可匹配;在黑名單模式下,多個關鍵字需要全部都匹配。例如在白名單時,事件資源輸入框輸入:instanceId_1,instanceId_2,代表執行個體ID為instanceId_1或者instanceId_2的事件都會被過濾出來。
閾值事件:當閾值警示規則滿足警示條件時,會同時觸發CloudMonitor的閾值事件,通過訂閱閾值事件,您可以對警示通知進行細粒度的控制和定製化,例如:合并降噪、自訂通知方式等。您需要設定閾值事件的訂閱範圍,包括:產品分類、監控指標、嚴重等級和應用分組。
合并降噪
說明如果您不設定合并規則,則預設會合并訂閱策略接受的所有警示。
合并內容
從訂閱類型的訂閱範圍中選擇合并維度。
降噪
降低警示通知的頻率。包括以下三種:
條件觸發,觸發後抑制通知:表示某段時間(預設5分鐘)內連續觸發幾次(預設5次)通知後,進入某段時間(預設5分鐘)的沉默期,沉默期內不再週期性通知,沉默期結束後重複此流程。
直接觸發,觸發後抑制通知:表示觸發警示後直接通知,通知後進入某段時間(預設5分鐘)的沉默期,沉默期不再週期性通知,沉默期結束後重複此流程。
直接觸發,不抑制(使用系統預設的防風暴設定):表示觸發警示後,直接發送通知。
通知
通知配置
當系統事件或閾值事件達到警示條件後,直接通知警示連絡人或根據警示層級通知不同的警示連絡人。
您可以選擇已有通知配置,也可以單擊建立通知配置,新建立一個通知配置。
關於如何設定通知配置策略的相關參數,請參見管理通知配置。
自訂通知方式
自訂警示通知方式。
單擊某種通知方式後面的修改,修改通知模板和警示層級。
推送與整合
推送渠道
警示通知的推送渠道。建立推送渠道的具體操作如下:
單擊建立新推送。
選擇已有推送渠道,或單擊添加渠道,新建立一個推送渠道。
關於如何設定推送渠道的相關參數,請參見管理推送渠道。
單擊提交。
調試事件訂閱。
在訂閱策略頁簽,單擊調試事件訂閱。
在建立事件調試面板,產品選擇ApsaraDB for MongoDB,名稱選擇執行個體故障開始。
系統自動產生JSON格式的調試內容。
單擊確定。
系統提示操作成功,CloudMonitor自動根據訂閱策略中的通知方式給警示連絡人發送一條警示測試通知。
設定警示
建立警示連絡人或警示聯絡組,具體請參見建立警示連絡人或警示連絡人群組。
登入MongoDB管理主控台。
根據執行個體類型,在左側導覽列,單擊複本集執行個體列表或分區叢集執行個體列表。
在頁面左上方,選擇執行個體所在的資源群組和地區。
單擊目標執行個體ID或目標執行個體所在行操作列的管理。
設定事件警示。
在目標執行個體頁面的左側導覽列,單擊警示規則。
單擊設定警示規則跳轉至CloudMonitor控制台。
單擊建立警示規則。
在建立警示規則面板,設定以下參數。
參數
說明
產品
無需修改,預設為當前執行個體的類型。
資源範圍
警示規則作用於指定雲產品的指定資源,預設為執行個體。
關聯資源
無需修改,預設為當前執行個體的執行個體ID。
規則描述
警示規則的主體。當監控資料滿足警示條件時,觸發警示規則。規則描述的設定方法如下:
單擊添加規則。
在設定規則描述面板,先輸入規則名稱,再設定指標類型。
單指標:先選擇監控指標,再為其設定閾值和警示層級。
多指標:先選擇警示層級,再為兩個或兩個以上的監控指標設定警示條件。
智能閾值:關於智能閾值的更多資訊,請參見概覽和建立智能閾值警示規則。
說明智能閾值功能處於邀測階段,您需要提交工單申請。
單擊確定。
說明關於如何設定複雜的警示條件,請參見警示規則運算式說明。
通道沉默周期
警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。
例如:當通道沉默周期選擇12小時時,如果警示未恢複正常,則間隔12小時後,CloudMonitor會再次發送警示通知。
生效時間
警示規則的生效時間。警示規則僅在生效期內才會發送警示通知。
說明當警示規則不在生效期時,不會發送警示通知,但是警示記錄仍然會顯示在報警歷史列表中。
警示連絡人群組
發送警示的連絡人群組。
應用分組的警示通知會發送給該警示連絡人群組中的警示連絡人。警示連絡人群組是一組警示連絡人,可以包含一個或多個警示連絡人。
關於如何建立警示連絡人和警示連絡人群組,請參見建立警示連絡人或警示連絡人群組。
標籤
警示規則的標籤。包括標籤名稱和標籤值。
說明您最多可設定6組標籤。
警示回調
公網可訪問的URL,用於接收CloudMonitor通過POST請求推送的警示資訊。目前僅支援HTTP協議。關於如何設定警示回調,請參見使用閾值警示回調。
當您需要測試警示回調地址的連通性時,可以執行以下操作。
單擊回調地址右側的測試。
在WebHook測試面板,您可以通過Webhook返回的狀態代碼和測試結果詳情對警示回調地址的連通性進行判斷和排查。
說明您還可以設定Webhook的回調模板類型和語言,再次單擊測試,擷取對應的測試結果詳情。
單擊關閉。
說明單擊進階設定,可設定該參數。
Auto Scaling
如果您開啟Auto Scaling開關,當警示發生時,會觸發相應的伸縮規則。您需要設定Auto Scaling的地區、Auto Scaling組和Auto Scaling規則。
說明單擊進階設定,可設定該參數。
Log Service
如果您開啟Log Service開關,當警示發生時,會將警示資訊發送至Log Service的日誌庫。您需要設定Log Service的地區、ProjectName和Logstore。
關於如何建立Project和Logstore,請參見快速入門:使用Logtail採集ECS文本日誌並分析。
說明單擊進階設定,可設定該參數。
輕量訊息佇列(原 MNS)— topic
如果您開啟輕量訊息佇列(原 MNS)— topic開關,當警示發生時,會將警示資訊發送至輕量訊息佇列的主題。您需要設定輕量訊息佇列的地區和主題。
關於如何建立主題,請參見建立主題。
說明單擊進階設定,可設定該參數。
Function Compute
如果您開啟Function Compute開關,當警示發生時,會將警示通知發送至Function Compute進行格式處理。您需要設定Function Compute的地區、服務和函數。
關於如何建立服務和函數,請參見快速建立函數。
說明單擊進階設定,可設定該參數。
無資料處理方法
無監控資料時警示的處理方式。取值:
不做任何處理(預設值)
發送無資料警示
視為恢複
說明單擊進階設定,可設定該參數。
單擊確定。
相關API
CloudMonitor產品的API介面 | 說明 |
建立或修改事件的警示規則。 |