PolarDB控制台提供了丰富的性能监控项和秒级监控频率,方便您掌握集群的运行状态并通过细粒度的监控数据快速定位运维问题。

性能监控

  1. 登录PolarDB控制台
  2. 在控制台左上角,选择集群所在地域。
  3. 找到目标集群,单击集群ID。
  4. 在左侧导航栏中,选择诊断与优化 > 性能监控
  5. 您可以根据业务需求选择查看集群计算节点高级监控监控信息。详细信息,请参见监控项说明
    • 集群性能监控:单击集群页签,在右侧设置时间段后单击确定性能监控-集群
    • 节点性能监控:单击计算节点页签,在右侧选择节点并设置时间段后单击确定性能监控-节点

监控项说明

类别 监控项 说明
集群 存储空间 展示数据空间、日志空间、临时空间和WAL日志空间的使用量。
CPU 展示各节点的CPU使用率。
内存 展示各节点的内存使用率。
节点 TPS 展示所选择节点的每秒事务数,包括每秒提交事务数、每秒死锁事务数、每秒回滚事务数等等。
CPU 展示所选择节点的CPU使用率。
内存 展示所选择节点的内存使用率。
连接 展示所选择节点的当前总连接数、活跃连接数和空闲连接数。
扫描行数 展示所选择节点每秒插入、读取、更新、删除、返回的行数。
数据库最大年龄 数据库最旧和最新的两个事务之间的事务ID差值。
I/O吞吐量 展示所选择节点的总I/O吞吐量、读I/O吞吐量、写I/O吞吐量。
IOPS 展示所选择节点的每秒读写次数,包括每秒读写总次数、每秒读次数、每秒写次数。
缓存 展示所选择节点每秒缓存读取次数和每秒磁盘读取次数。
缓存命中率 展示所选择节点的缓存命中率。
临时文件 展示所选择节点的临时文件数量和总大小。

常见问题

  • Q:当集群无业务流量时,为何性能监控中的QPS还显示为大约10次/秒?

    A:因为系统后台存在监控、日志采集以及管控任务,大概每秒会产生10个左右的查询请求,对集群运行基本无影响。

  • Q:CPU使用率过高时,应该如何解决?
    A:建议您按如下步骤进行排查:
    • 确认是否有大量慢请求,建议优化慢SQL后再进行测试。
    • 确认CPU曲线是否与QPS或TPS曲线走向一致,若一致,说明该问题是事务高并发导致,可以考虑升级集群配置。
    • 若没有慢请求,CPU曲线与QPS或TPS曲线走向也不一致,请提交工单联系技术支持解决。
  • Q:当前连接数远大于活跃连接数时,应该如何解决?

    A:您可以尝试将wait_timeoutinteractive_timeout参数值设置的小一些以加速空闲连接的释放。但建议最好在业务端使用完连接后及时关闭回收以减少空闲连接的存在。

相关API

API 描述
DescribeDBClusterPerformance 查询PolarDB集群的性能数据。
DescribeDBNodePerformance 查询PolarDB集群节点的性能数据。
DescribeDBClusterMonitor 查询PolarDB集群监控数据的采集频率。
ModifyDBClusterMonitor 修改PolarDB集群监控数据的采集频率。