為規避物理機故障產生的執行個體宕機風險,我們會嘗試執行線上維護操作,如熱升級或熱遷移等,同時推出執行個體效能影響的系統事件(SystemMaintenance.PerformanceImpact),為您傳遞線上維護可能引起執行個體效能影響的事件資訊。

背景資訊

系統事件是影響執行個體運行狀態的有計劃或非預期事件。特指因探測到更新維護、違規操作、系統故障、軟硬體故障、因預付費即將到期或帳號欠費,發生的重啟、停止或者釋放ECS執行個體等操作的事件。系統事件提供多種查詢方式,滿足營運人員、營運系統、第三方雲產品消費使用,構建閉環操作。更多詳情,請參閱系統事件

本文描述如何通過CloudMonitor查詢和訂閱執行個體效能影響的系統事件(SystemMaintenance.PerformanceImpact),該事件主要有以下兩種生命週期狀態:

  • Executing:事件開始,即開始熱遷移。
  • Executed:事件結束,即結束熱遷移。

通過CloudMonitor查看系統事件

  1. 登入CloudMonitor管理主控台
  2. 在左側導覽列,單擊事件監控
  3. 在事件查詢分頁下,選擇系統事件 > ECS > 全部事件,或者將全部事件細分到執行個體效能影響開始(系統維護)執行個體效能影響結束(系統維護),您可以定位到即將或者已經發生系統事件的ECS執行個體。

添加警示連絡人

如果您已經設定了警示連絡人,可以跳過此環節。

  1. 登入CloudMonitor管理主控台
  2. 在左側導覽列,單擊警示服務 > 警示連絡人
  3. 單擊建立連絡人,按如下樣本添加警示連絡人。

    说明 關於如何添加DingTalk機器人的樣本,請參閱如何通過DingTalk群接受警示通知

通過CloudMonitor訂閱事件通知

  1. 登入CloudMonitor管理主控台
  2. 在左側導覽列,單擊事件監控
  3. 在警示規則分頁下,選擇系統事件 > 建立事件警示

  4. 建立/修改事件警示頁面,按以下樣本設定警示通知後單擊確定完成建立。

訂閱效果樣本

簡訊訂閱效果:



郵件訂閱效果:

DingTalk機器人訂閱效果:



補充:通過API查詢執行個體系統事件

如果您是擁有大規模ECS執行個體的企業級使用者,推薦您使用API方式查詢和處理系統事件。基於程式化處理的方式並配合其他營運動作構建自動化營運。本樣本以API以調用介面DescribeInstanceHistoryEvents為例,您可以通過調試平台OpenAPI Explorer查詢執行個體的系統事件,以及最近一周的曆史事件:

  1. 登入OpenAPI Explorer控制台
  2. 在左側導覽列中,選擇Elastic Compute Service,在出現的介面搜尋欄中輸入DescribeInstanceHistoryEvents
  3. 在請求參數處填入執行個體相關資訊後單擊發送請求,並在返回參數處查看事件資訊:
    • 請求參數:RegionId(地區ID)、InstanceId(執行個體ID)、EventId.N(事件ID)
    • 返回參數:InstanceId(執行個體ID)、EventId(事件ID)、EventType(事件類型,本文主要關注SystemMaintenance.PerformanceImpact)、EventCycle(事件狀態)、PublishTime(事件初始發布UTC時間)、NotBeforeTime(事件執行UTC時間)、FinishTime(事件結束UTC時間)