系統事件監控為使用者提供各類雲產品產生的系統事件的統一統計和查詢入口,使得使用者明確知曉雲產品的使用狀態,讓雲更透明。

通過應用分組進行資源分類後,產品產生的系統事件會自動與組中資源關聯,協助您做各類監控資訊的資訊整合,方便您的業務出現問題時,快速分析、定位問題。

同時提供事件的警示功能,使用者可以根據事件等級配置警示,通過SMS、郵件、釘釘等接收通知或設定警示回調。使得使用者第一時間知曉嚴重事件並及時處理,形成線上自動化營運閉環。

查看系統事件

  • 方式一
    1. 登入Cloud Monitor控制台,進入事件監控頁面。
    2. 過濾框選擇系統事件,查看指定時間內發生的事件。

    3. 單擊操作中的查看詳情,查看相關事件詳細資料。
  • 方式二

    如果您的執行個體通過應用分組進行歸類管理,您還可以進入具體的應用分組查看分組內相關執行個體的系統事件。

    1. 登入Cloud Monitor控制台,進入應用分組頁面。
    2. 選擇進入分組的詳情頁面,選擇菜單中的事件監控
    3. 頁面中展示的系統事件即為該分組中執行個體相關的系統事件。

設定警示

所有系統事件均可以配置警示規則,當事件發生時及時通知您。設定方法如下:

  1. 進入系統事件頁面,單擊相應事件的建立警示規則操作,進入建立警示規則頁面。
  2. 選擇需要接收的事件資訊和連絡人。選擇連絡人時,對應連絡人會收到雲帳號下所有執行個體產生的事件。選擇應用分組時,應用分組關聯的連絡人會收到組內執行個體產生的事件。

支援的雲產品系統事件

  • ECS系統事件
    事件名稱 事件含義 狀態 事件等級
    Instance:InstanceFailure.Reboot 因執行個體錯誤執行個體重啟開始 Executing CRITICAL
    Instance:InstanceFailure.Reboot 因執行個體錯誤執行個體重啟結束 Executed CRITICAL
    Instance:SystemFailure.Reboot 因系統錯誤執行個體重啟開始 Executing CRITICAL
    Instance:SystemFailure.Reboot 因系統錯誤執行個體重啟結束 Executed CRITICAL
    Instance:SystemMaintenance.Reboot 因系統維護執行個體計劃重啟 Scheduled CRITICAL
    Instance:SystemMaintenance.Reboot 因系統維護執行個體計劃重啟已規避 Avoided CRITICAL
    Instance:SystemMaintenance.Reboot 因系統維護執行個體計劃重啟執行中 Executing CRITICAL
    Instance:SystemMaintenance.Reboot 因系統維護執行個體計劃重啟已完成 Executed CRITICAL
    Instance:SystemMaintenance.Reboot 因系統維護執行個體計劃重啟已取消 Canceled CRITICAL
    Instance:SystemMaintenance.Reboot 因系統維護執行個體計劃重啟已失敗 Failed CRITICAL
    Disk:Stalled 磁碟效能受到嚴重影響開始 Executing CRITICAL
    Disk:Stalled 磁碟效能受到嚴重影響結束 Executed CRITICAL
  • SLB系統事件
    事件名稱 事件含義 事件等級
    CertKeyExpired_1 認證將在1天后到期 WARN
    CertKeyExpired_3 認證將在3天后到期 WARN
    CertKeyExpired_7 認證將在7天后到期 WARN
    CertKeyExpired_15 認證將在15天后到期 WARN
    CertKeyExpired_30 認證將在30天后到期 WARN
    CertKeyExpired_60 認證將在60天后到期 WARN
  • OSS系統事件
    事件名稱 事件含義 事件等級
    BucketEgressBandwidth bucket下行頻寬超過彙報閾值 INFO
    BucketEgressBandwidthThresholdExceeded bucket下行頻寬超過流控閾值 WARN
    BucketIngressBandwidth bucket上行頻寬超過彙報閾值 INFO
    BucketIngressBandwidthThresholdExceeded bucket上行頻寬超過流控閾值 WARN
    UserEgressBandwidth user下行頻寬超過彙報閾值 INFO
    UserEgressBandwidthThresholdExceeded user下行頻寬超過流控閾值 WARN
    UserIngressBandwidth user上行頻寬超過彙報閾值 INFO
    UserIngressBandwidthThresholdExceeded user上行頻寬超過流控閾值 WARN
  • ESSAuto Scaling系統事件
    事件名稱 事件含義 狀態 事件等級
    AUTOSCALING:SCALE_IN_ERROR Auto Scaling組縮容伸縮活動失敗 unnormal CRITICAL
    AUTOSCALING:SCALE_IN_SUCCESS Auto Scaling組縮容伸縮活動成功 normal INFO
    AUTOSCALING:SCALE_OUT_ERROR Auto Scaling組擴容伸縮活動失敗 unnormal CRITICAL
    AUTOSCALING:SCALE_OUT_SUCCESS Auto Scaling組擴容伸縮活動成功 normal INFO
    AUTOSCALING:SCALE_REJECT Auto Scaling組伸縮活動執行被拒絕 warn WARN
    AUTOSCALING:SCHEDULE_TASK_EXPIRING 定時任務到期提醒 warn WARN
    AUTOSCALING:SCALE_OUT_START Auto Scaling組擴容伸縮活動開始 normal INFO
    AUTOSCALING:SCALE_IN_START Auto Scaling組縮容伸縮活動開始 normal INFO
  • Alibaba Cloud IoT系統事件
    事件名稱 事件含義 狀態 事件等級
    RuleEngineProcessFail 規則引擎處理失敗 failed WARN
  • Smart Access Gateway系統事件
    事件名稱 事件含義 狀態 事件等級
    AccessGatewayFailover 存取點切換 agwfailover INFO
    ConnectionDisconnect 網路連接斷開 disconnect CRITICAL
    DeviceHacked 裝置被攻擊 hacked CRITICAL
    DeviceOffline 裝置離線 offline CRITICAL
    DeviceOnline 裝置上線 online INFO
  • Cloud Monitor系統事件
    事件名稱 事件含義 狀態 事件等級
    Group_AddResourcesFailed_QuotaReached 超過資源上限,動態添加機器到分組失敗 failed CRITICAL
  • Database BackupDBS
    事件名稱 事件含義 狀態 事件等級
    CloseContBackup 關閉增量記錄備份 failed INFO
    ContBackupFail 增量備份異常 failed WARN
    DataRestoreFail 資料恢複異常 failed WARN
    DataRestoreSuccess 資料恢複成功 running WARN
    FullBackupFail 全量備份異常 failed WARN
    InstancePause 備份計劃暫停 failed INFO
    InstanceStart 備份計劃啟動 running INFO
    OpenContBackup 開啟增量記錄備份 running INFO