云数据库ClickHouse提供了丰富的性能监控数据,方便您查看和掌握集群的运行状态。本文介绍如何在控制台查看集群监控信息。

前提条件

  • 已开通阿里云Prometheus服务。
  • 已升级云数据库ClickHouse
说明 首次使用集群监控时,会在监控告警页面看到需要开通阿里云Prometheus和需要升级云数据库ClickHouse的提醒。如果在监控告警页面显示了监控信息,说明已经开通了阿里云Prometheus服务并且云数据库ClickHouse集群符合查看监控信息的要求。

操作步骤

  1. 登录云数据库ClickHouse控制台
  2. 在页面左上角,选择目标集群所在的地域。
  3. 集群列表页面,单击目标集群ID。
  4. 单击左侧导航栏中的监控告警
  5. 监控告警页面,选择集群监控,默认展示最新1小时的集群监控信息。
    为提升用户体验,云数据库ClickHouse对控制台进行了优化,2021年12月01日之后购买的集群提供了更加全面的性能监控数据。
    说明 为方便理解,本文将优化之前的控制台称为旧控制台,优化之后的控制台称为新控制台,此分类仅适用于本功能。

    2021年12月01日之后购买的集群,监控信息具体请参见新控制台监控项。2021年12月01日之前购买的集群,监控信息具体请参见旧控制台监控项

新控制台监控项

监控项说明
磁盘吞吐磁盘读写的吞吐量(带宽)。
磁盘IOPS磁盘每秒进行读写操作的次数。
磁盘使用量磁盘空间的使用量。单位:MB。
磁盘使用率磁盘空间的使用量与最多可使用的磁盘空间容量的比值。
inode使用率inode的使用个数占最多可使用的总个数的比值。
说明 inode是Linux系统中来标识文件或目录的。
Data Part个数数据分片的总数。
内存使用量集群各节点的内存使用量。单位:MB。
Inactive Data Part个数不活跃的数据分片个数。
CPU使用率集群各节点的平均CPU使用率。
内存使用率集群各节点的平均内存使用率。
每秒写入大小集群各节点每秒写入的数据量。单位:Byte。
网络吞吐网络带宽。单位:Byte。
QPS每秒处理的查询数目。
每秒写入行数集群各节点每秒写入的行数。
TCP连接数集群的TCP连接个数。
TPS每秒处理的事务数目。
运行Query个数正在运行的查询语句个数。
运行Init Query个数正在运行的非转发查询语句个数。
运行Mutation个数正在运行的数据订正任务个数。
HTTP连接数集群的HTTP连接个数。
分布式DDL个数分布式DDL语句的个数。
失败Query个数查询失败的语句个数。
MaterializeMySQL个数使用MaterializeMySQL引擎创建的同步数据库个数。
失败Insert Query个数插入失败的语句个数。
Kafka外表个数已创建的Kafka外表个数。
失败Select Query个数查询失败的语句个数。
冷存使用量冷数据的存储量。单位:Byte。
运行Merge个数正在运行的合并任务个数。
MaterializeMySQL同步失败个数使用MaterializeMySQL引擎创建的同步数据库同步失败个数。
延迟Insert个数延迟的插入语句个数。
Kafka外表消费发生错误个数同步失败的Kafka外表消费个数。
分布式表临时文件个数分布式表临时文件的个数。
ZooKeeper CPU使用率集群ZooKeeper节点的平均CPU使用率。
ZooKeeper 内存使用率集群ZooKeeper节点的平均内存使用率。

旧控制台监控项

监控项说明
CPU使用率集群各节点的CPU使用率。
内存使用率集群各节点的内存使用率。
内存使用量集群各节点的内存使用量。单位:MB。
磁盘使用比率磁盘空间的使用量与最多可使用的磁盘空间容量的比值。
磁盘使用量使用中的磁盘空间大小。单位:MB。
磁盘IOPS磁盘每秒进行读写操作的次数。
磁盘IOPS大小磁盘每秒读写数据的大小。
数据库连接使用比率数据库使用连接数与规格最大可使用连接数的比值。
数据库使用连接数数据库使用中的连接数目。
TPS每秒处理的事务数目。
每秒写入行数各节点每秒写入的行数。
每秒写入大小各节点每秒写入的大小。单位:MB。
QPS每秒处理的查询数目。
ZK的平均等待时长反应当前ZooKeeper的响应性能。单位:毫秒。
平均IO等待时长反应当前IO的响应性能。单位:毫秒。
平均CPU等待时长反应当前CPU的响应性能。单位:毫秒。