通過查看叢集監控資訊,您可即時掌握節點、儲存和作業資源的使用方式,精確最佳化資源配置和任務調度。同時,允許您自訂監控時間範圍,並提供便捷的歷史資料查詢功能,助您做出明智的調整和管理決策,確保叢集持續高效運行。本文介紹如何查看E-HPC的監控資訊。
前提條件
-
叢集需滿足以下條件:
-
狀態為運行中。
-
叢集部署模式為公用雲叢集。
-
調度器為SLURM和PBS。
-
叢集監控組件已正常安裝。
-
-
如果使用RAM使用者操作,請確保RAM使用者具有通過控制台查看監控資訊的許可權。具體操作,請參見為RAM使用者授權。
操作步驟
進入集群详情頁面。
登入彈性高效能運算控制台。
在頂部功能表列左上方處,選擇地區。
在左側導覽列,單擊集群。
在叢集列表頁面,單擊目標叢集名稱。
在左側導覽列,選擇。
-
根據需要,單擊對應頁簽,以查看E-HPC的監控資訊。
說明當您查看節點監控、儲存監控或作業監控資訊時,您可以指定查詢的時間範圍。
-
快速選擇:可選擇查看近1小時、4小時、12小時或1天的監控資訊。
-
自訂:精確選擇要查詢監控資訊的時間範圍,時間範圍的起止時間點間隔最長為1個月。
有關各頁簽及對應監控指標詳細說明,請參見監控指標說明。

-
監控指標說明
|
頁簽 |
說明 |
|
概览 |
包含計算節點總數、共用儲存空間、作業總數、平均負載四個統計資訊,並可以查看所有計算節點状态及資源使用方式。 計算節點調度狀態說明如下所示:
|
|
節點監控 |
您可以通過叢集、隊列兩個維度進行篩選,查看以下六個可視化統計資訊:
|
|
儲存監控 |
您可以查看該叢集內不同檔案系統下的儲存監控資訊,包括以下六個可視化統計資訊:
|
|
作業監控 |
您可以通過叢集、隊列、專案和使用者四個維度進行篩選,查看以下六個可視化統計資訊:
|