全部產品
Search
文件中心

ApsaraDB for OceanBase (Deprecated):租戶 CPU 負載警示

更新時間:Jul 01, 2024

警示描述

OceanBase 租戶在單節點上負載過高時觸發該警示。

租戶節點負載的計算方式為:該租戶所在的節點 cpu usage / 該租戶的 cpu。

規則資訊

警示項

指標類型

監控指標名

預設閾值

期間(連續觸發警示周期數)

檢測周期

警示層級

租戶 CPU 負載警示

單指標

租戶 / CPU 使用率

90

15

1 分鐘

Warn

對系統的影響

CPU 過載會導致 TPS/QPS 時延過大或者服務逾時,從而影響正常服務。

可能原因

常見原因包括:

  • 業務產生了大查詢或熱點資料。

  • 租戶的資源規劃比實際偏小、業務產生了意外熱點情境。

處理方法

  1. 檢查是否是應用正常的負載。

    1. 登入OceanBase,在 叢集列表 中,選擇叢集名,進入 叢集工作台

    2. 單擊 租戶管理,選擇租戶,進入 租戶工作台

    3. 租戶工作台效能監控 介面,查看 CPU 使用率 的折線圖,判斷圖中警示時間點的 CPU 使用率在較長時間內(1-7 天)是否突然增大。

      • 有,則為非正常負載。

      • 否,為正常負載(正常流量引起負載過高,考慮對租戶規格進行擴容)。

        OB 節點 CPU 使用率過高-1

  2. 可能是大查詢或熱點流量引起的負載過高。可根據如下不同情境進行相應的處理。

    • SQL 執行存在大查詢,在 診斷 頁面的 TopSQL 頁簽中查看是否有 CPU 使用率過高的 SQL。

      • 如有,可對該 SQL 進行最佳化。

      • 如無,則不為該原因。

        OB 節點 CPU 使用率過高-2

    • 存在 SlowSQL 導致負載過高。在 診斷 頁面的 SlowSQL 頁簽中查看具體的診斷結果,分析是否可能導致 CPU 負載過高。如可能,請對該 SQL 進行最佳化。

    • 針對問題 SQL 在診斷頁面上使用限流功能。