為了讓您可以即時掌握雲資料庫ClickHouse叢集的狀態,協助您早期問題發現,快速定位故障,效能最佳化決策,雲資料庫ClickHouse提供了豐富的監控項。本文介紹雲資料庫ClickHouse叢集的監控項以及其具體含義。
ClickHouse叢集監控項說明
以下監控項是2021年12月01日之後購買的叢集監控項詳情。
2021年12月01日之前購買的叢集,監控項詳情,請參見舊版叢集監控項說明。
社區版
監控項 | 單位 | 說明 |
磁碟吞吐 | 位元組(Byte) | 磁碟讀寫的輸送量(頻寬)。 |
磁碟IOPS | 次/秒 | 磁碟每秒進行讀寫操作的次數。 |
磁碟使用量 | 位元組(Byte) | 磁碟空間的使用量。 |
磁碟使用量-單節點統計 | 位元組(Byte) | 磁碟使用量(單節點上所有磁碟使用量總和)。 |
磁碟使用率 | 百分比(%) | 磁碟空間的使用量與最多可使用的磁碟空間容量的比值。 |
磁碟使用率-單節點統計 | 百分比(%) | 磁碟使用率(以節點為單位統計磁碟使用率)。 |
CPU使用率 | 百分比(%) | 叢集各節點的平均CPU使用率。 |
inode使用率 | 百分比(%) | inode的使用個數占最多可使用的總個數的比值。 說明 inode是Linux系統中用來標識檔案或目錄的。 |
記憶體使用量量 | 位元組(Byte) | 叢集各節點的記憶體使用量量。 |
記憶體使用量率 | 百分比(%) | 叢集各節點的平均記憶體使用量率。 |
Data Part個數 | 個 | 資料分區的總數。 |
Inactive Data Part個數 | 個 | 不活躍的資料分區個數。 |
ZooKeeper CPU使用率 | 百分比(%) | 叢集ZooKeeper節點的平均CPU使用率。 |
ZooKeeper 記憶體使用量率 | 百分比(%) | 叢集ZooKeeper節點的平均記憶體使用量率。 |
每秒寫入大小 | 位元組(Byte) | 叢集各節點每秒寫入的資料量。 |
每秒寫入行數 | 行/秒 | 叢集各節點每秒寫入的行數。 |
QPS | 個 | 每秒處理的查詢數目。 |
TPS | 個 | 每秒處理的事務數目。 |
網路吞吐 | 位元組(Byte) | 網路頻寬。 |
TCP串連數 | 個 | 叢集的TCP串連個數。 |
HTTP串連數 | 個 | 叢集的HTTP串連個數。 |
運行Init Query個數 | 個 | 正在啟動並執行非轉寄查詢語句個數。 |
運行Query個數 | 個 | 正在啟動並執行查詢語句個數。 |
失敗Query個數 | 個 | 查詢失敗的語句個數。 |
失敗Insert Query個數 | 個 | 插入失敗的語句個數。 |
延遲Insert個數 | 個 | 延遲的插入語句個數。 |
失敗Select Query個數 | 個 | 查詢失敗的語句個數。 |
運行Merge個數 | 個 | 正在啟動並執行合并任務個數。 |
運行Mutation個數 | 個 | 正在啟動並執行資料訂正任務個數。 |
分布式表臨時檔案個數 | 個 | 分布式表臨時檔案的個數。 |
MaterializeMySQL個數 | 個 | 使用MaterializeMySQL引擎建立的同步資料庫個數。 |
冷存使用量 | 位元組(Byte) | 冷資料的儲存量。 |
MaterializeMySQL同步失敗個數 | 個 | 使用MaterializeMySQL引擎建立的同步資料庫同步失敗個數。 |
Kafka外表消費發生錯誤個數 | 個 | 同步失敗的Kafka外表消費個數。 |
Zookeeper Leader | - | Zookeeper叢集的Leader(取值為1的為leader節點)。 |
Kafka外表個數 | 個 | 已建立的Kafka外表個數。 |
節點隊列堆積量 | 個 | 雲資料庫ClickHouse節點在Zookeeper上發送隊列的資料包數量。 |
Zookeeper平均時延 | 毫秒 | Zookeeper節點的平均時延。 |
Zookeeper Node數 | 個 | Zookeeper的ZNode數量。 |
Zookeeper TPS | 次/秒 | Zookeeper的TPS。 |
Zxid使用率 | 百分比(%) | Zookeeper的Zxid使用率(Zxid使用率達到100%時會發生重新選主)。 |
企業版
監控項 | 單位 | 監控說明 |
CPU使用率 | 百分比(%) | 叢集各節點的平均CPU使用率。 |
CCU | 個 | 叢集計算資源的使用量。 |
記憶體使用量量 | 位元組(Byte) | 叢集各節點的記憶體使用量量。 |
記憶體使用量率 | 百分比(%) | 叢集各節點的平均記憶體使用量率。 |
OSS使用量 | 位元組(Byte) | 叢集儲存資源的使用量。 |
Data Part個數 | 個 | 資料分區的總數。 |
Inactive Data Part個數 | 個 | 不活躍的資料分區個數。 |
Keeper CPU使用率 | 百分比(%) | ClickHouse-Keeper的CPU使用率。 |
Keeper記憶體使用量量 | 位元組(Byte) | ClickHouse-Keeper的記憶體使用量量。 |
Keeper記憶體使用量率 | 百分比(%) | ClickHouse-Keeper的記憶體使用量率。 |
每秒寫入大小 | 位元組(Byte) | 叢集各節點每秒寫入的資料量。 |
每秒寫入行數 | 行/秒 | 叢集各節點每秒寫入的行數。 |
網路吞吐 | 位元組(Byte) | 磁碟讀寫的輸送量(頻寬)。 |
OSS網路吞吐 | 位元組(Byte) | OSS讀寫的輸送量(頻寬)。 |
OSS IOPS | 次/秒 | OSS每秒進行讀寫操作的次數。 |
TPS | 次/秒 | 每秒處理的事務數目。 |
QPS | 次/秒 | 每秒處理的查詢數目。 |
運行Init Query個數 | 個 | 正在啟動並執行非轉寄查詢語句個數。 |
運行Query個數 | 個 | 正在啟動並執行查詢語句個數。 |
失敗Query個數 | 個 | 節點中失敗的Query數量。 |
失敗Insert Query個數 | 個 | 插入失敗的語句個數。 |
延遲Insert個數 | 個 | 延遲的插入語句個數。 |
失敗Select Query個數 | 個 | 節點中失敗的Select Query數量。 |
運行Mutation個數 | 個 | 正在啟動並執行資料訂正任務的數。 |
運行Merge個數 | 個 | 正在啟動並執行合并任務個數。 |
TCP串連數 | 個 | 叢集的TCP串連個數。 |
HTTP串連數 | 個 | 叢集的HTTP串連個數。 |
MV Refresh失敗數 | 個 | 叢集中Refreshable Materialized View重新整理失敗個數。 |
MV Refresh平均耗時 | 時間(秒/分鐘) | 叢集中Refreshable Materialized View重新整理平均耗時。 |
MV Refresh最大耗時 | 時間(秒/分鐘) | 叢集中Refreshable Materialized View重新整理最大耗時。 |
舊版叢集監控項說明
舊版叢集指的是2021年12月01日之前購買的社區版叢集。
監控項 | 單位 | 說明 |
CPU使用率 | 百分比(%) | 叢集各節點的CPU使用率。 |
記憶體使用量率 | 百分比(%) | 叢集各節點的記憶體使用量率。 |
記憶體使用量量 | 位元組(Byte) | 叢集各節點的記憶體使用量量。 |
磁碟使用比率 | 百分比(%) | 磁碟空間的使用量與最多可使用的磁碟空間容量的比值。 |
磁碟使用量 | 位元組(Byte) | 使用中的磁碟空間大小。 |
磁碟IOPS | 次/秒 | 磁碟每秒進行讀寫操作的次數。 |
磁碟IOPS大小 | 位元組(Byte) | 磁碟每秒讀寫資料的大小。 |
資料庫連接使用比率 | 百分比(%) | 資料庫使用串連數與規格最大可使用串連數的比值。 |
資料庫使用串連數 | 個 | 資料庫使用中的串連數。 |
TPS | 次/秒 | 每秒處理的事務數目。 |
每秒寫入行數 | 行/秒 | 各節點每秒寫入的行數。 |
每秒寫入大小 | 位元組(Byte) | 各節點每秒寫入的大小。 |
QPS | 次/秒 | 每秒處理的查詢數目。 |
ZK的平均等待時間長度 | 毫秒 | 反映當前ZooKeeper的響應效能。 |
平均IO等待時間長度 | 毫秒 | 反映當前IO的響應效能。 |
平均CPU等待時間長度 | 毫秒 | 反映當前CPU的響應效能。 |