通過查看CPFS智算版檔案系統的容量監控和效能資訊,您可以瞭解CPFS智算版檔案系統的儲存容量使用方式和讀寫吞吐、讀寫IOPS等情況。通過為CPFS智算版檔案系統的重要監控指標設定警示規則,您可以及時獲知指標異常並快速處理異常。本文介紹CPFS智算版檔案系統支援的監控項以及其警示規則配置。
背景資訊
CloudMonitor(CloudMonitor)是一項針對阿里雲資源和互連網應用進行監控的服務。CloudMonitor可用於監控各雲端服務資源的監控指標,並針對指定監控指標設定警示。使您全面瞭解阿里雲上資源的使用方式和業務健全狀態,並及時對故障資源進行處理,保證業務正常運行。更多資訊,請參見什麼是CloudMonitor。
監控資料保留原則
監控資料保留90天,到期自動清除。起始時間為資料產生的時間。
監控指標
CPFS智算版支援通過CloudMonitor對檔案系統容量、執行個體效能以及用戶端效能進行全面監控。並為此提供了新版(推薦)和舊版兩套監控指標。新版指標旨在解決舊版命名不規範、結構不清晰的問題,提供了更好的易用性和可維護性。
新使用者:建議直接使用新版指標。
存量使用者:可繼續使用舊版以確保商務持續性,但建議逐步遷移至新版。
存量使用者如需切換使用新版指標,建議先在測試環境進行適配。
新版監控指標(推薦)
新版監控指標目前已在以下地區上線:華北2(北京)。
容量監控
類型 | 指標 | 指標名稱 | 單位 | 說明 |
檔案系統-標準規格 | BmStdCapacity | 智算版標準規格檔案系統總儲存空間 | 位元組 (B) | 檔案系統的總儲存空間。 |
BmStdCapacityUsed | 智算版標準規格檔案系統資料量 | 位元組 (B) | 檔案系統當前實際使用的資料量。 | |
BmStdInodeLimit | 智算版標準規格檔案系統最大檔案數 | 個 | 檔案系統可容納的最大檔案和目錄總數。 | |
BmStdInodeAlloc | 智算版標準規格檔案系統已指派檔案數 | 個 | 檔案系統當前已指派(建立)的檔案和目錄總數。 | |
BmStdInodeUsed | 智算版標準規格檔案系統已使用檔案數 | 個 | 檔案系統當前實際使用的檔案和目錄總數。 | |
檔案系統-大規格 大規格檔案系統僅對部分使用者開放,非大規格檔案系統使用者請忽略大規格相關指標。 | BmLargeCapacity | 智算版大規格檔案系統總儲存空間 | 位元組 (B) | 檔案系統的總儲存空間。 |
BmLargeCapacityUsed | 智算版大規格檔案系統資料量 | 位元組 (B) | 檔案系統當前實際使用的資料量。 | |
BmLargeInodeLimit | 智算版大規格檔案系統最大檔案數 | 個 | 檔案系統可容納的最大檔案和目錄總數。 | |
BmLargeInodeAlloc | 智算版大規格檔案系統已指派檔案數 | 個 | 檔案系統當前已指派(建立)的檔案和目錄總數。 | |
BmLargeInodeUsed | 智算版大規格檔案系統已使用檔案數 | 個 | 檔案系統當前實際使用的檔案和目錄總數。 | |
Fileset-標準規格 | BmStdFsetCapacityLimit | 智算版標準規格 Fileset 容量配額 | 位元組 (B) | 為單個Fileset設定的容量配額上限。 |
BmStdFsetCapacityUsed | 智算版標準規格 Fileset 當前容量 | 位元組 (B) | 單個Fileset當前實際使用的容量。 | |
BmStdFsetInodeLimit | 智算版標準規格 Fileset 檔案數配額 | 個 | 為單個Fileset設定的檔案和目錄數量的配額上限。 | |
BmStdFsetInodeAlloc | 智算版標準規格 Fileset 預分配檔案數 | 個 | 單個Fileset當前預分配的檔案和目錄總數。 | |
BmStdFsetInodeUsed | 智算版標準規格 Fileset 當前檔案數 | 個 | 單個Fileset當前實際使用的檔案和目錄數量。 | |
Fileset-大規格 大規格檔案系統僅對部分使用者開放,非大規格檔案系統使用者請忽略大規格相關指標。 | BmLargeFsetCapacityLimit | 智算版大規格 Fileset 容量配額 | 位元組 (B) | 為單個 Fileset 設定的可用容量上限。 |
BmLargeFsetCapacityUsed | 智算版大規格 Fileset 當前容量 | 位元組 (B) | 單個 Fileset 當前實際使用的資料量。 | |
BmLargeFsetInodeLimit | 智算版大規格 Fileset 檔案數配額 | 個 | 為單個 Fileset 設定的可容納的最大檔案和目錄總數。 | |
BmLargeFsetInodeAlloc | 智算版大規格 Fileset 預分配檔案數 | 個 | 單個 Fileset 當前已指派(建立)的檔案和目錄總數。 | |
BmLargeFsetInodeUsed | 智算版大規格 Fileset 當前檔案數 | 個 | 單個 Fileset 當前實際使用的檔案和目錄總數。 |
效能監控
類型 | 指標 | 指標名稱 | 單位 | 說明 |
檔案系統-標準規格 | BmStdReadThroughput | 智算版標準規格檔案系統讀吞吐 | 位元組/秒 (B/s) | 檔案系統在周期內每秒平均讀吞吐位元組。 |
BmStdWriteThroughput | 智算版標準規格檔案系統寫吞吐 | 位元組/秒 (B/s) | 檔案系統在周期內每秒平均寫吞吐位元組。 | |
BmStdReadIops | 智算版標準規格檔案系統讀IOPS | 次/秒 (IOPS) | 檔案系統在周期內每秒平均讀IOPS次數。 | |
BmStdWriteIops | 智算版標準規格檔案系統寫IOPS | 次/秒 (IOPS) | 檔案系統在周期內每秒平均寫IOPS次數。 | |
BmStdReadLatency | 智算版標準規格檔案系統讀延遲 | 毫秒 (ms) | 檔案系統在周期內的平均讀延遲。 | |
BmStdWriteLatency | 智算版標準規格檔案系統寫延遲 | 毫秒 (ms) | 檔案系統在周期內的平均寫延遲。 | |
BmStdMetaQps | 智算版標準規格檔案系統中繼資料 QPS | 次/秒 (IOPS) | 檔案系統在周期內每秒平均請求中繼資料次數。 | |
BmStdMetaLatency | 智算版標準規格檔案系統中繼資料延遲 | 毫秒 (ms) | 檔案系統在周期內的中繼資料操作平均延遲。 | |
檔案系統-大規格 大規格檔案系統僅對部分使用者開放,非大規格檔案系統使用者請忽略大規格相關指標。 | BmLargeReadThroughput | 智算版大規格檔案系統讀吞吐 | 位元組/秒 (B/s) | 檔案系統在周期內每秒平均讀吞吐位元組。 |
BmLargeWriteThroughput | 智算版大規格檔案系統寫吞吐 | 位元組/秒 (B/s) | 檔案系統在周期內每秒平均寫吞吐位元組。 | |
BmLargeReadIops | 智算版大規格檔案系統讀IOPS | 次/秒 (IOPS) | 檔案系統在周期內每秒平均讀IOPS次數。 | |
BmLargeWriteIops | 智算版大規格檔案系統寫IOPS | 次/秒 (IOPS) | 檔案系統在周期內每秒平均寫IOPS次數。 | |
BmLargeReadLatency | 智算版大規格檔案系統讀延遲 | 毫秒 (ms) | 檔案系統在周期內的平均讀延遲。 | |
BmLargeWriteLatency | 智算版大規格檔案系統寫延遲 | 毫秒 (ms) | 檔案系統在周期內的平均寫延遲。 | |
BmLargeMetaQps | 智算版大規格檔案系統中繼資料操作 QPS | 次/秒 (IOPS) | 檔案系統在周期內每秒平均請求中繼資料次數。 | |
BmLargeMetaLatency | 智算版大規格檔案系統中繼資料操作延遲 | 微秒 (us) | 檔案系統在周期內的中繼資料操作平均延遲。 | |
用戶端 | ClientReadThroughput | 智算版用戶端讀吞吐 | 位元組/秒 (B/s) | 用戶端在周期內的每秒平均讀吞吐位元組。 |
ClientWriteThroughput | 智算版用戶端寫吞吐 | 位元組/秒 (B/s) | 用戶端在周期內的每秒平均寫吞吐位元組。 | |
ClientReadIops | 智算版用戶端讀 IOPS | 次/秒 (IOPS) | 用戶端在周期內的讀IOPS每秒平均次數。 | |
ClientWriteIops | 智算版用戶端寫 IOPS | 次/秒 (IOPS) | 用戶端在周期內的寫IOPS每秒平均次數。 | |
ClientReadLatency | 智算版用戶端讀平均延遲 | 微秒 (us) | 用戶端在周期內的平均讀延遲。 | |
ClientWriteLatency | 智算版用戶端寫平均延遲 | 微秒 (us) | 用戶端在周期內的平均寫延遲。 | |
ClientMetaLatency | 智算版用戶端中繼資料延遲 | 毫秒 (ms) | 用戶端完成單次中繼資料操作的平均延遲。 | |
ClientMetaQps | 智算版用戶端中繼資料 QPS | 次/秒 (IOPS) | 用戶端在周期內每秒平均請求中繼資料次數。 | |
串連數 | VpcClientCount | 智算版VPC 用戶端數量 | 個 | 通過VPC串連到檔案系統的用戶端總數。 |
RdmaClientCount | 智算版RDMA 用戶端數量 | 個 | 通過RDMA串連到檔案系統的用戶端總數。 |
彈性檔案用戶端是由CPFS團隊裝在計算節點上的用戶端,用於計算節點連通CPFS智算版檔案系統。
用戶端效能僅支援通過CloudMonitor控制台或調用CloudMonitorAPI查看,具體操作,請參見查看CPFS效能監控或查看CPFS效能監控。
在ECS或PAI靈駿智算(單租版)資源中使用CPFS智算版檔案系統時,hostname為節點的主機名稱。
在PAI通用計算資源或PAI靈駿智算資源中使用CPFS智算版檔案系統時,hostname為任務的pod id。
更多新版監控指標資訊可在CloudMonitor指標查詢查看。
舊版監控指標
容量監控
類型 | 指標 | 指標名稱 | 單位 | 說明 |
檔案系統 | CPFSCapacity | 總儲存空間 | 位元組 | 檔案系統在周期內的總儲存空間。 |
CPFSCapacityUsed | 資料量 | 位元組 | 檔案系統在周期內實際使用的資料量。 | |
CPFSInode Limit | 最大檔案數 | 個 | 檔案系統在周期內的可使用的最大檔案數量。 | |
CPFSInode Alloc | 已指派檔案數 | 個 | 檔案系統在周期內已指派的檔案數量。 | |
CPFSInode Used | 已使用檔案數 | 個 | 檔案系統在周期內已使用的檔案數量。 | |
Fileset | BMCPFSFsetCapacityLimit | Fileset已指派容量 | 位元組 | 已指派容量為Fileset最多可寫入的容量空間,達到配額上限後無法再寫入新資料。 |
BMCPFSFsetCapacityUsed | Fileset已使用容量 | 位元組 | Fileset的實際已使用容量。 | |
BMCPFSFsetInodeLimit | Fileset已指派檔案數 | 個 | 已指派檔案數為Fileset最多可寫入的檔案與目錄數量,達到配額上限後無法再寫入資料。 | |
BMCPFSFsetInodeUsed | Fileset已使用檔案數 | 個 | Fileset的實際已使用檔案數。 |
效能監控
類型 | 指標 | 指標名稱 | 單位 | 說明 |
檔案系統 | ThruputRead | 讀吞吐 | 位元組/秒 | 檔案系統在周期內每秒平均讀吞吐位元組。 |
ThruputWrite | 寫吞吐 | 位元組/秒 | 檔案系統在周期內每秒平均寫吞吐位元組。 | |
IopsRead | 讀IOPS | 次/秒 | 檔案系統在周期內每秒平均讀IOPS次數。 | |
IopsWrite | 寫IOPS | 次/秒 | 檔案系統在周期內每秒平均寫IOPS次數。 | |
資料流動 | ThroughputImport | 匯入吞吐 | 位元組/秒 | 資料流動匯入任務在周期內每秒平均吞吐位元組。 |
ThroughputExport | 匯出吞吐 | 位元組/秒 | 資料流動匯出任務在周期內每秒平均吞吐位元組。 | |
QPSImportMeta | 匯入中繼資料QPS | 次/秒 | 資料流動匯入任務在周期內每秒平均請求中繼資料次數。 | |
QPSExportMeta | 匯出中繼資料QPS | 次/秒 | 資料流動匯出任務在周期內每秒平均請求中繼資料次數。 | |
IOPSImport | 匯入IOPS | 次/秒 | 資料流動匯入任務在周期內IOPS每秒平均次數。 | |
IOPSEXport | 匯出IOPS | 次/秒 | 資料流動匯出任務在周期內IOPS每秒平均次數。 | |
LatencyImport | 匯入延遲 | us | 資料流動匯入任務在周期內的平均延遲。 | |
LatencyExport | 匯出延遲 | us | 資料流動匯出任務在周期內的平均延遲。 | |
用戶端 | ClientReadIops | 用戶端讀IOPS | 次/秒 | 用戶端在周期內的讀IOPS每秒平均次數。 |
ClientWriteIops | 用戶端寫IOPS | 次/秒 | 用戶端在周期內的寫IOPS每秒平均次數。 | |
ClientReadLatency | 用戶端讀平均延遲 | us | 用戶端在周期內的平均讀延遲。 | |
ClientWriteLatency | 用戶端寫平均延遲 | us | 用戶端在周期內的平均寫延遲。 | |
ClientReadThroughput | 用戶端讀吞吐 | 位元組/秒 | 用戶端在周期內的每秒平均讀吞吐位元組。 | |
ClientWriteThroughput | 用戶端寫吞吐 | 位元組/秒 | 用戶端在周期內的每秒平均寫吞吐位元組。 |
彈性檔案用戶端是由CPFS團隊裝在計算節點上的用戶端,用於計算節點連通CPFS智算版檔案系統。
用戶端效能僅支援通過CloudMonitor控制台或調用CloudMonitorAPI查看,具體操作,請參見查看CPFS效能監控或查看CPFS效能監控。
在ECS或PAI靈駿智算(單租版)資源中使用CPFS智算版檔案系統時,hostname為節點的主機名稱。
在PAI通用計算資源或PAI靈駿智算資源中使用CPFS智算版檔案系統時,hostname為任務的pod id。
更多舊版監控指標資訊可在CloudMonitor指標查詢查看。
警示規則說明
通過CloudMonitor控制台,您可以為不同監控指標設定警示規則。當資源的監控指標達到警示條件時,CloudMonitor會自動發送警示通知。下表列出了警示規則的警示層級、通知機制以及警示條件資訊。
警示等級 | 通知機制 | 警示條件 |
緊急Critical | 電話+簡訊+郵件+DingTalk機器人 | 連續N個周期監控指標的平均值與指定閾值滿足所設定的判斷條件。其中N值請根據警示等級進行區分設定。 說明 當所選的指標類型不同時,警示條件會存在差異,請以實際介面為準。 |
警告Warn | 簡訊+郵件+DingTalk機器人 | |
普通Info | 郵件+DingTalk機器人 |