全部產品
Search
文件中心

Microservices Engine:配置預設警示

更新時間:Dec 27, 2024

本文介紹如何配置預設警示。

操作步驟

  1. 登入MSE註冊配置中心管理主控台,並在頂部功能表列選擇地區。

  2. 在左側導覽列,選擇注册配置中心 > 实例列表

  3. 執行個體列表頁面,單擊目標執行個體操作列下的更多 > 配置預設警示

  4. 配置預設警示對話方塊,選擇警示連絡人分組,然後單擊確定

    單擊確定後,將自動添加以下預設警示規則。

    叢集類型

    叢集版本

    警示名稱

    說明

    解決方案

    註冊配置中心通用

    基礎版、開發版、專業版

    叢集CPU使用率過高

    叢集節點CPU使用率超過80%

    叢集版本缺陷或容量不足,請檢查風險管理中的風險項並根據建議解決,如果風險解決後仍未恢複警示,請擴容。

    叢集記憶體使用量率過高

    叢集節點記憶體使用量率超過90%

    ZooKeeper

    基礎版、開發版、專業版

    ZooKeeper CMS Gc次數過多

    一分鐘內叢集CMS Gc次數超過5次

    ZooKeeper CMS Gc時間過長

    一分鐘內CMS Gc總時間超過6s

    Serverless

    Snapshot限流

    Snapshot大小超過20M,接近25M限制值

    叢集最大支援25M Snapshot,如果需要更大空間,請提工單

    Nacos

    基礎版、開發版、專業版

    Nacos Full Gc次數過多

    一分鐘內叢集Full Gc次數超過2次

    叢集容量不足,請檢查使用的用戶端的方式是否有誤,造成串連泄漏/重複註冊/重複訂閱等問題。如果沒有,請及時擴容或升配。

    Nacos Full Gc時間過長

    一分鐘內叢集Full Gc時間超過5s

    基礎版、開發版、專業版、Serverless

    Nacos服務使用率過高

    服務數使用率超過90%

    Nacos服務提供者使用率過高

    服務提供者數使用率超過90%

    Nacos串連數使用率過高

    串連數使用率超過90%

    Nacos配置數使用率過高

    配置數使用率超過90%

    Nacos配置長輪詢使用率過高

    配置長輪詢使用率超過90%

    Nacos服務提供者比例環比下跌過高

    比較目前時間和3分鐘前的Nacos叢集服務提供者數,發現Nacos叢集服務提供者下跌超過50%,可能導致業務上遊服務無法找到下遊服務提供者

    檢測到短時間內大批量服務掉線,疑似應用存在故障或大規模發布,請檢查業務應用是否正處於變更發布中。如果不是,請檢查業務應用的CPU、記憶體使用量、GC、網路等資源是否健康。

    Serverless

    TPS限流事件

    叢集觸發TPS限流

    提工單

    服務容量限制事件

    叢集觸發服務容量限制

    串連數量限制事件

    叢集觸發串連數限制

    配置容量限制事件

    叢集觸發配置容量限制

    Ingress

    專業版

    叢集CPU使用率過高

    叢集CPU使用率超過80%

    叢集容量不足,請檢查是否存在外掛程式記憶體流失/邏輯錯誤等問題。如果沒有,請及時擴容。

    叢集記憶體使用量率過高

    叢集記憶體使用量率超過80%

    專業版、Serverless

    網關整體正確率異常

    網關整體正確率低於80%

    網關正確率異常,請檢查網關配置以及業務是否異常。

    網關自訂外掛程式出現異常,已經自動回復

    網關自訂外掛程式異常,已自動回復

    外掛程式崩潰,請檢查外掛程式邏輯。