本文介紹Log Service警示監控規則的常見問題。
是否支援動態設定不同警示嚴重度?
支援。您可以在配置警示監控規則時,根據不同條件設定警示嚴重度。更多資訊,請參見設定警示嚴重度。
是否支援無資料警示?
支援。您可以在配置警示監控規則時,開啟無資料警示功能,並配置獨立的嚴重度等資訊。更多資訊,請參見無資料警示。
是否支援警示自動回復檢測機制?
支援。您可以在配置警示監控規則時,開啟警示恢複功能。更多資訊,請參見設定恢複通知。
一條警示監控規則是否支援給不同目標發送警示通知?
支援。您可以在配置警示監控規則時,開啟分組評估功能。更多資訊,請參見設定分組評估。
是否支援臨時關閉警示監控規則?
支援。您可以在警示規則頁面,操作列單擊關閉。
使用RAM使用者操作警示時,如何為RAM使用者授權?
當您使用RAM使用者操作警示時,需要先授予RAM使用者警示操作許可權。具體操作,請參見授權RAM使用者操作警示。
建立警示監控規則時,遇到Alert count exceeds the maximum limit錯誤,如何處理?
如果您在建立警示監控規則時,系統出現Alert count exceeds the maximum limit錯誤,表示該Project下的警示監控規則超過了最大限制(預設100個)。您可以通過管理資源配額進行擴容。
單個Project中最大可擴容至200個,如果您還需要建立更多的警示監控規則,可考慮如下最佳化方案。
刪除該Project下無用的警示監控規則。
將日誌採集到不同的Project中,減少單個Project下的警示監控規則數量。
例如將服務A的日誌採集到Project1中,將服務B的日誌採集到Project2中,則您可以在不同的Project中建立警示監控規則。
合并相似的警示監控規則。
例如監控同一個LogStore中的資料時,您可以只建立一個警示監控規則,通過分組評估實現使用一條警示監控規則同時監控多個目標。更多資訊,請參見設定分組評估。
通過資料加工或定時查詢與分析(定時SQL)將資料存放區到一個LogStore後再建立警示監控規則。
例如您要監控多個LogStore中的錯誤記錄檔,則可以將所有的錯誤記錄檔儲存到一個LogStore中,然後基於該LogStore建立一個警示監控規則。
如何基於關鍵字設定警示?
將日誌採集到Log Service後,您可以通過Log Service警示系統實現基於日誌關鍵字的警示。具體操作,請參見基於日誌關鍵字設定警示。
如何監控不同的對象?
在某些情況下,您無法提前知道目標欄位的所有取值,但需要監控該欄位在任意取值時是否滿足警示觸發條件,那麼就可以使用分組評估功能,選擇該欄位作為標籤進行分組,每個分組單獨評估警示的觸發條件。更多資訊,請參見設定分組評估。
例如,您將多個伺服器的指標資料存放區在一個時序庫中,但希望每個伺服器的CPU使用率(cpu_util)超過95%時,Log Service可以分開發送每個伺服器的警示資訊,則可以使用分組評估。
為什麼設定了多個觸發條件,只有一個生效?
查詢統計結果按照觸發條件的順序逐條匹配,當查詢統計結果符合第一個觸發條件後,不再匹配後面的觸發條件。因此當您設定觸發條件中的嚴重度時,需從較進階別的嚴重度開始配置。具體操作,請參見設定警示嚴重度。
為什麼出現漏警示或者誤警示?
漏警示:例如警示觸發條件是錯誤記錄檔數大於10就觸發警示,而在LogStore查詢分析頁面查詢時某個時間段內錯誤記錄檔數實際大於10 ,卻沒有觸發警示。
誤警示:例如警示觸發條件是QPS低於100就觸發警示,而在LogStore查詢分析頁面查詢時某個時間段內QPS實際大於100,卻觸發了警示。
出現漏警示或者誤警示,一般是由於資料寫入到LogStore到可查詢存在一定的延遲,當警示監控規則中的查詢時間範圍設定為相對時間時,會導致警示的查詢不完全準確。為了避免這兩種情況,建議擴大警示監控規則中的查詢時間範圍或者將查詢時間範圍設定為整點時間。更多資訊,請參見監控時效性說明。
在警示歷史圖中,當是否觸發警示為true,原因為Notify threshold not reached時,如何處理?
如果警示歷史統計儀錶盤的警示歷史圖表中,是否觸發警示顯示為true,而原因顯示為Notify threshold not reached,表示您在警示監控規則中設定了連續觸發閾值,而此次觸發還未達到連續觸發閾值。例如設定連續觸發閾值為3次,那麼連續3次都滿足觸發條件,才會真正觸發警示。
