在阿里雲ECS,您可以對每台執行個體執行定期檢查,監控執行個體健康狀態。本文介紹如何在ECS控制台上或通過API來查看執行個體健康情況。

功能優勢

執行個體健康情況不同於執行個體的生命週期狀態(如PendingRunningStopped),執行個體健康情況側重於網路設定的異常活動、軟體崩潰和硬體使用方式等。通過監視執行個體健康狀態,您可以及時記錄網路、軟體或硬體問題,以保持您的應用程式在阿里雲ECS中持續運行。

同時,配合使用CloudMonitor的指標監視功能,您可以靈活地自訂計算資源維護的健康水位。

健康狀態

當您發起健康狀態檢查的請求後,阿里雲為執行的每台執行個體查詢返回健康情況。如果通過了健康情況檢查,則健康情況為無異常。如果健康情況檢查失敗,則健康情況會返回其他指標。有關健康情況的取值列表,請參見下表:

控制台文案 API參數取值 描述 控制台警示顏色
無異常 OK 已通過健康情況檢查 綠色
服務受損 Impaired 執行個體效能受損 紅色
健康預警 Warning 執行個體效能可能因維護或技術問題而降低
系統維護 Maintaining 執行個體處於維護中
初始化中 Initializing 正在初始化執行個體
資料不足 InsufficientData 由於資料不足,無法確定健康情況
無狀態 NotApplicable 執行個體健康情況不適用

在ECS控制台查看執行個體健康狀態

  1. 登录ECS管理控制台
  2. 在左侧导航栏,选择实例与镜像 > 实例
  3. 在顶部状态栏处,选择地域。
  4. 找到要查看健康狀態的執行個體,然後單擊執行個體ID。
  5. 執行個體詳情頁面的右上方處,查看執行個體健康狀態。

通過API查看執行個體健康狀態

本文以阿里雲CLI為例示範如何調用ECS API。 關其他開發人員工具的使用說明,請參見ECS API快速入門。詳細的地區ID列表請參見地區和可用性區域

  • 執行以下命令,通過調用DescribeInstancesDescribeInstancesFullStatus查看特定執行個體的健康狀態:
    aliyun ecs DescribeInstances --RegionId TheRegionId --output cols=InstanceId,InstanceName
    aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --InstanceId.1 i-bp1afnc98r8k69XXXXXX --output cols=HealthStatus
  • 執行以下命令,通過調用DescribeInstancesFullStatus查看指定地區下所有執行個體的健康情況:
    aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --output cols=HealthStatus