ARMS警示管理的智能降噪功能能夠協助您從大量歷史事件中挖掘出重要的事件。同時,結合噪音事件閾值(資訊熵閾值)的設定,您也可以完成噪音事件的過濾和屏蔽。您只需要一鍵式開啟,即可體驗開箱即用的智能降噪能力。本文介紹如何開啟並配置智能降噪功能。
背景資訊
目前,市面上各監控工具一般通過設定閾值或動態閾值的方式,識別指標異常並觸發警示事件。各監控工具通常也會支援設定預設規則,觸發監控工具預設的規則事件,例如:機器重啟。營運團隊往往不會依賴一套監控工具,而會選擇不同工具,設定對應的監控警示。在這樣的背景下,由於設定的監控源和監控工具多,往往導致相同的故障原因在各大監控工具的不同監控規則下,觸發出大量重複、冗餘的警示事件。在發生大範圍故障時,甚至會形成警示風暴。營運人員很難從這些海量警示中,快速有效地識別出到底哪些警示事件是重要的,這也往往導致有效警示被淹沒。
- 多處監控、警示源,以及頻繁誤判導致大量重複、冗餘、低效事件,而重要事件淹沒在其中,無法有效識別。
- 大範圍故障導致警示風暴。
- 測試事件等髒資料,混雜在事件中。
智能降噪的實現原理
ARMS警示管理可以將不同警示源收歸到統一平台進行警示事件的處理,包含事件處理流,事件的智能降噪等功能。其中智能降噪利用自然語言處理演算法,基於資訊理論中的資訊量和資訊熵(資訊熵是自資訊的期望值,用來表徵事件包含的資訊量的多少,單位為bit或nats。)的概念來表徵事件的重要性,協助您從大量歷史事件中挖掘出重要的事件。同時,結合資訊熵閾值的設定,您也可以完成噪音事件的過濾和屏蔽。您只需要一鍵式開啟,即可體驗到開箱即用的智能降噪能力。隨著時間的演化、事件類型和內容變化,模型也將自適應並定期實現迭代式更新(更新頻率為每周一次),無需您進行任何操作。
- 基於自然語言處理和領域詞彙庫,完成事件內容的詞向量化,實現事件最小粒度的度量。
- 基於資訊理論中資訊熵的概念,結合TF-IDF模型,構建詞向量的資訊熵值和重要性度量模型。
- 利用SIGMOD,完成事件的非線性和歸一化“資訊熵”度量。
- 結合歷史事件的處理記錄和反饋,構建模型迭代訓練。
開啟智能降噪
- 登入ARMS控制台。
- 在左側導覽列選擇。
- 在事件列表頁面開啟智能降噪開關。
說明 開啟後智能降噪後,ARMS警示管理會拉取近一個月的歷史事件數目據(如果一個月內事件數目量過多,則會先拉取部分)進行智能模型訓練。
查看智能降噪詳情


| 參數 | 說明 |
| 已分析事件 | 智能降噪功能已分析過的事件數目量。 |
| 已識別噪音事件 | 事件資訊熵低於設定資訊熵閾值(預設資訊熵閾值為0)的事件,統稱為噪音事件。 |
| 噪音事件識別比例 | 噪音事件占已分析事件的比例。 |
| 事件資訊熵分布圖 | 顯示噪音事件和非噪音事件的分布情況。 |
| 分析結果 | 您可以在分析結果地區查看已分析事件列表,並可以通過是否為噪音事件、資訊熵等參數篩選需要查看的事件。單擊事件所在行可以查看事件的詳細資料。 |
| 常見詞Top 50 | 根據歷史事件的統計學習,模型會儲存一份事件詞彙的詞頻表。常見詞則是詞頻表按照出現頻率大小排序,選擇Top 50進行展示。通過常見詞,您可以更詳細的瞭解當前帳號下的警示事件,並參考常見詞設定智能降噪的優先詞和屏蔽詞。 |
配置智能降噪模型參數
在智能降噪詳情頁面您可以配置噪音事件閾值、優先詞和屏蔽詞。
| 參數 | 說明 |
| 噪音事件閾值 | 開啟智能降噪後,ARMS警示管理會對每一條新事件計算資訊熵值。噪音事件閾值設定是劃分噪音和非噪音事件的分界線。預設噪音事件閾值為0。 |
| 優先詞 | 在關鍵詞設定中,您可以設定想要優先看到的詞彙,例如:重要、Critical等。當發生事件的事件名稱和事件內容包含設定的優先詞時,當前事件的優先順序相對應提高,避免事件被識別成噪音事件。 |
| 屏蔽詞 | 在關鍵詞設定中,您可以設定一些您認為不重要的詞彙,例如:測試、Test等。當發生事件的事件名稱和事件內容包含設定的屏蔽詞時,當前事件會被直接認定為資訊熵為0,如果噪音事件閾值設定大於0,則當前事件會被認定為噪音事件。 |
常見問題
- 什麼時候開啟智能降噪功能?
已經存在大量歷史事件,同時事件中存在大量的重複、冗餘,或無法識別重要事件。
內部實踐發現從歷史事件數目量超過1000開始,模型效果逐步變優。
- 是否需要修改模型參數(噪音事件閾值、優先詞和屏蔽詞)?
建議在初期使用智能降噪時不修改模型參數,採用預設值即可。在瞭解功能後,可以嘗試設定優先詞和屏蔽詞,以及噪音事件閾值,實現更多定製化的需求。