警示描述
OceanBase 租戶在單節點上負載過高時觸發該警示。
租戶節點負載的計算方式為:該租戶所在的節點 cpu usage / 該租戶的 cpu。
規則資訊
警示項 | 指標類型 | 監控指標名 | 預設閾值 | 期間(連續觸發警示周期數) | 檢測周期 | 警示層級 |
|---|---|---|---|---|---|---|
租戶 CPU 負載警示 | 單指標 | 租戶 / CPU 使用率 | 90 | 15 | 1 分鐘 | Warn |
對系統的影響
CPU 過載會導致 TPS/QPS 時延過大或者服務逾時,從而影響正常服務。
可能原因
常見原因包括:
業務產生了大查詢或熱點資料。
租戶的資源規劃比實際偏小、業務產生了意外熱點情境。
處理方法
檢查是否是應用正常的負載。
登入OceanBase,在 叢集列表 中,選擇叢集名,進入 叢集工作台。
單擊 租戶管理,選擇租戶,進入 租戶工作台。
在 租戶工作台 的 效能監控 介面,查看 CPU 使用率 的折線圖,判斷圖中警示時間點的 CPU 使用率在較長時間內(1-7 天)是否突然增大。
有,則為非正常負載。
否,為正常負載(正常流量引起負載過高,考慮對租戶規格進行擴容)。

可能是大查詢或熱點流量引起的負載過高。可根據如下不同情境進行相應的處理。
SQL 執行存在大查詢,在 診斷 頁面的 TopSQL 頁簽中查看是否有 CPU 使用率過高的 SQL。
如有,可對該 SQL 進行最佳化。
如無,則不為該原因。

存在 SlowSQL 導致負載過高。在 診斷 頁面的 SlowSQL 頁簽中查看具體的診斷結果,分析是否可能導致 CPU 負載過高。如可能,請對該 SQL 進行最佳化。
針對問題 SQL 在診斷頁面上使用限流功能。