全部產品
Search
文件中心

Database Autonomy Service:異常檢測

更新時間:Sep 04, 2025

及時探索資料庫的異常問題是資料庫日常營運的重點。資料庫自治服務DAS提供異常檢測功能,基於機器學習和細粒度的監控資料,無需手動開啟,自動實現7x24小時的異常檢測。相比基於規則或閾值的警示方式,能夠更及時地探索資料庫異常變化。

前提條件

  • 目標資料庫執行個體為:

    資料庫

    地區

    • RDS MySQL

    • MyBase MySQL

    • 公用雲

      華東1(杭州)、華東2(上海)、華南1(深圳)、華南2(河源)、華南3(廣州)、華北1(青島)、華北2(北京)、華北3(張家口)、華北5(呼和浩特)、華北6(烏蘭察布)、華東5 (南京-本地地區-關停中)華東6(福州-本地地區-關停中)、西南1(成都)、鄭州、中國(香港)、日本(東京)、韓國(首爾)、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、菲律賓(馬尼拉)、泰國(曼穀)、阿聯酋(杜拜)、沙特(利雅得)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)和英國(倫敦)

    • 金融雲

      華東1(杭州)金融雲、華東2(上海)金融雲、華南1(深圳)金融雲和華北2(北京) 金融雲(邀測)

    • 政務雲

      華北2(北京)阿里政務雲1

    RDS PostgreSQL

    • 公用雲

      華東1(杭州)、華東2(上海)、華南1(深圳)、華南2(河源)、華南3(廣州)、華北1(青島)、華北2(北京)、華北3(張家口)、華北5(呼和浩特)、華北6(烏蘭察布)、西南1(成都)、中國(香港)、日本(東京)、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、菲律賓(馬尼拉)、阿聯酋(杜拜)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)和英國(倫敦)

    • 金融雲

      華東1(杭州)金融雲、華東2(上海)金融雲和華南1(深圳)金融雲

    • 政務雲

      華北2(北京)阿里政務雲1

    RDS SQL Server

    • 公用雲

      華東1(杭州)、華東2(上海)、華南1(深圳)、華南2(河源)、華北1(青島)、華北2(北京)、華北3(張家口)、華北5(呼和浩特)、華北6(烏蘭察布)、西南1(成都)、中國(香港)、日本(東京)、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、阿聯酋(杜拜)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)和英國(倫敦)

    • 金融雲

      華東1(杭州)金融雲、華東2(上海)金融雲和華南1(深圳)金融雲

    • 政務雲

      華北2(北京)阿里政務雲1

    PolarDB MySQL版標準版、企業叢集版

    • 公用雲

      華東1(杭州)、華東2(上海)、華南1(深圳)、華南2(河源)、華南3(廣州)、華北1(青島)、華北2(北京)、華北3(張家口)、華北5(呼和浩特)、華北6(烏蘭察布)、西南1(成都)、中國(香港)、日本(東京)、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、菲律賓(馬尼拉)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)和英國(倫敦)

    • 金融雲

      華東1(杭州)金融雲、華東2(上海)金融雲、華南1(深圳)金融雲和華北2(北京) 金融雲(邀測)

    • 政務雲

      華北2(北京)阿里政務雲1

    雲資料庫 Tair(相容 Redis)

    • 開源版

    • Tair(Redis企業版)記憶體型

    • 公用雲

      華東1(杭州)、華東2(上海)、華南1(深圳)、華南2(河源)、華南3(廣州)、華北1(青島)、華北2(北京)、華北3(張家口)、華北5(呼和浩特)、西南1(成都)、中國(香港)、日本(東京)、韓國(首爾)、新加坡、馬來西亞(吉隆坡)、印尼(雅加達)、菲律賓(馬尼拉)、泰國(曼穀)、阿聯酋(杜拜)、沙特(利雅得)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)和英國(倫敦)

    • 金融雲

      華東1(杭州)金融雲、華東2(上海)金融雲、華南1(深圳)金融雲和華北2(北京) 金融雲(邀測)

    • 政務雲

      華北2(北京)阿里政務雲1

    Tair(Redis企業版)持久記憶體型、磁碟型

    • 公用雲

      華東1(杭州)、華東2(上海)、華南1(深圳)、華北2(北京)、華北3(張家口)、中國(香港)、新加坡、德國(法蘭克福)和美國(維吉尼亞)

    • 政務雲

      華北2(北京)阿里政務雲1

  • 目標資料庫執行個體已接入DAS,並且接入狀態顯示為接入正常

    說明

    接入資料庫執行個體的操作請參見接入阿里雲資料庫執行個體

功能介紹

基於機器學習和細粒度的監控資料,無需手動開啟,自動實現7x24小時的異常檢測。相比基於規則或閾值的警示方式,能更及時地探索資料庫異常變化。

對比項

傳統方式

DAS異常檢測

方式

基於規則、閾值。

基於AI。

檢測項

主要基於監控指標。

監控指標、SQL、日誌、鎖、營運事件等。

即時性

至少5分鐘,甚至到天。

准即時。

檢測原理

故障驅動。

異常驅動。

周期性識別

無。

自動識別。

適應性

無法自適應業務特徵。

自適應業務特徵。

預測能力

無。

具備預測能力。

查看異常檢測結果

在DAS的自治中心,可以直接查看選定時間範圍內檢測到的例外狀況事件。

  1. 登入DAS控制台

  2. 在左側導覽列中,單擊智能營運中心 > 執行個體監控

  3. 找到目標執行個體,單擊執行個體ID,進入目標執行個體詳情頁。

  4. 在左側導覽列中,單擊自治中心

  5. 選擇時間範圍,查看指定時間範圍內的例外狀況事件。

開啟事件訂閱

開啟事件訂閱功能後,如果檢測到例外狀況事件,DAS將會根據您設定的方式進行通知(例如手機簡訊),協助您及時探索資料庫異常變化。詳情請參見開啟事件訂閱功能

說明

例外狀況事件的異常層級為警告,您可以根據實際情況設定事件通知的異常層級。

常見問題

  • 監控指標時序異常檢測(時序異常檢測)事件的異常快照中,異常指標分析的相關指標變化倍數是如何計算得出的?

    指標變化倍數=實際指標值/預測指標值。DAS會使用資料庫執行個體過去一段時間內小時層級的資料預測資料庫執行個體當前時刻的指標值,以預測指標值作為基準與當前實際指標值進行對比,從而得出指標變化倍數。異常指標

  • 為什麼建立的執行個體或節點流量平穩,但出現了較多的監控指標時序異常檢測(時序異常檢測)事件?

    DAS的異常檢測功能是先基於執行個體的歷史資料建立預測模型,然後利用該模型進行異常檢測。對於新建立的執行個體或節點,其效能資料水位相對較低,因此基於此資料所建立的預測模型的資料水位也會相應較低。在業務操作發生後,可能會導致一段時間內指標與預測模型資料差異較大(出現偽突增),從而引發較為密集的異常檢測事件。

    說明

    經過一段時間的資料積累後,DAS會自動重建立立更為準確的預測模型,偽突增導致的監控指標時序異常檢測(時序異常檢測)事件也會消失。

  • 為什麼執行個體效能指標在某幾秒有明顯的異常,但未觸發監控指標時序異常檢測(時序異常檢測)事件?

    DAS的異常檢測功能是使用分鐘級的平均資料進行檢測,某幾秒的異常可能會因對該資料影響較小而被平滑,從而導致該異常無法被檢測到(不會觸發監控指標時序異常檢測(時序異常檢測)事件)。

相關文檔

您可以利用DAS的自治功能,在資料庫出現異常時進行自動處理。