本文介紹如何配置預設警示。
操作步驟
登入MSE註冊配置中心管理主控台,並在頂部功能表列選擇地區。
在左側導覽列,選擇注册配置中心 > 实例列表。
在執行個體列表頁面,單擊目標執行個體操作列下的更多 > 配置預設警示。
在配置預設警示對話方塊,選擇警示連絡人分組,然後單擊確定。
單擊確定後,將自動添加以下預設警示規則。
叢集類型
叢集版本
警示名稱
說明
解決方案
註冊配置中心通用
基礎版、開發版、專業版
叢集CPU使用率過高
叢集節點CPU使用率超過80%
叢集版本缺陷或容量不足,請檢查風險管理中的風險項並根據建議解決,如果風險解決後仍未恢複警示,請擴容。
叢集記憶體使用量率過高
叢集節點記憶體使用量率超過90%
ZooKeeper
基礎版、開發版、專業版
ZooKeeper CMS Gc次數過多
一分鐘內叢集CMS Gc次數超過5次
ZooKeeper CMS Gc時間過長
一分鐘內CMS Gc總時間超過6s
Serverless
Snapshot限流
Snapshot大小超過20M,接近25M限制值
叢集最大支援25M Snapshot,如果需要更大空間,請提工單。
Nacos
基礎版、開發版、專業版
Nacos Full Gc次數過多
一分鐘內叢集Full Gc次數超過2次
叢集容量不足,請檢查使用的用戶端的方式是否有誤,造成串連泄漏/重複註冊/重複訂閱等問題。如果沒有,請及時擴容或升配。
Nacos Full Gc時間過長
一分鐘內叢集Full Gc時間超過5s
基礎版、開發版、專業版、Serverless
Nacos服務使用率過高
服務數使用率超過90%
Nacos服務提供者使用率過高
服務提供者數使用率超過90%
Nacos串連數使用率過高
串連數使用率超過90%
Nacos配置數使用率過高
配置數使用率超過90%
Nacos配置長輪詢使用率過高
配置長輪詢使用率超過90%
Nacos服務提供者比例環比下跌過高
比較目前時間和3分鐘前的Nacos叢集服務提供者數,發現Nacos叢集服務提供者下跌超過50%,可能導致業務上遊服務無法找到下遊服務提供者
檢測到短時間內大批量服務掉線,疑似應用存在故障或大規模發布,請檢查業務應用是否正處於變更發布中。如果不是,請檢查業務應用的CPU、記憶體使用量、GC、網路等資源是否健康。
Serverless
TPS限流事件
叢集觸發TPS限流
服務容量限制事件
叢集觸發服務容量限制
串連數量限制事件
叢集觸發串連數限制
配置容量限制事件
叢集觸發配置容量限制
Ingress
專業版
叢集CPU使用率過高
叢集CPU使用率超過80%
叢集容量不足,請檢查是否存在外掛程式記憶體流失/邏輯錯誤等問題。如果沒有,請及時擴容。
叢集記憶體使用量率過高
叢集記憶體使用量率超過80%
專業版、Serverless
網關整體正確率異常
網關整體正確率低於80%
網關正確率異常,請檢查網關配置以及業務是否異常。
網關自訂外掛程式出現異常,已經自動回復
網關自訂外掛程式異常,已自動回復
外掛程式崩潰,請檢查外掛程式邏輯。