数据库自治服务DAS(Database Autonomy Service)支持监控大盘功能,您可以自主选择需要监控的数据库实例和指标,对不同数据库实例的指标进行监控对比,并且可以进行多指标联动,帮助您监控数据库实例的运行情况。

前提条件

新增监控大盘

  1. 登录DAS控制台
  2. 在左侧导航栏,单击监控大盘
  3. 自定义大盘页,选择对应的数据库引擎。
  4. 在目标引擎页,单击新增监控大盘
  5. 输入新增监控大盘的名称,单击确定
  6. 单击选择实例和指标,分别选中目标实例和需要查看的指标,并单击‪
    说明 监控指标的含义请参见监控指标
  7. 单击确认选择即可。
    说明 如果需要修改大盘中的实例或指标,可以单击添加实例和监控指标进行修改。

查看监控大盘中目标实例的指标趋势

  1. 登录DAS控制台
  2. 在左侧导航栏,单击监控大盘
  3. 自定义大盘页,选择对应的数据库引擎。
  4. 在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。
    说明 选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过七天。
    • 通过实例筛选,您可以选择多个实例,对比查看其监控指标。
    • 打开自动刷新,系统将以5秒为周期,刷新监控指标趋势图。
    • 打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。
    • 通过图表布局,您可以设置每行显示监控指标趋势图的数量。
    • 单击添加实例和监控指标,修改大盘中的实例或监控指标。
    • 单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。
    • 单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。

监控指标

表 1. RDS MySQL和自建MySQL监控指标
参数类型 参数 说明
MySQL Server tps TPS。
qps QPS。
active_session 当前活跃会话。
total_session 当前全部会话。
delete_ps 平均每秒Delete语句执行次数。
insert_ps 平均每秒Insert语句执行次数。
replace_ps 平均每秒Replace语句执行次数。
update_ps 平均每秒Update语句执行次数。
select_ps 平均每秒Select语句执行次数。
bytes_received 平均每秒从所有客户端接收到的字节数。
bytes_sent 平均每秒发送给所有客户端的字节数。
iops_usage IOPS利用率。
InnoDB存储引擎 innodb_bp_hit InnoDB Buffer Pool读缓存命中率。
innodb_bp_dirty_pct InnoDB Buffer Pool脏页比率。
innodb_bp_usage_pct InnoDB Buffer Pool使用率。
innodb_data_written InnoDB平均每秒写字节数。
innodb_data_read InnoDB平均每秒读字节数。
innodb_rows_deleted InnoDB平均每秒删除的行数。
innodb_rows_read InnoDB平均每秒读取的行数。
innodb_rows_inserted InnoDB平均每秒插入的行数。
innodb_rows_updated InnoDB平均每秒更新的行数。
MySQL服务进程 cpu_usage MySQL服务进程CPU使用率(阿里云数据库最高100%)。
mem_usage MySQL实例内存使用率(占操作系统总数)。
iops MySQL读写次数。
表 2. 云数据库Redis版和自建Redis监控指标
参数类型 参数 说明
数据库基本指标 instantaneous_ops_per_sec 每秒处理的命令数。
get_qps 每秒读命令请求数。
put_qps 每秒写命令请求数。
connection_usage 连接利用率。
inflow 网络每秒的读取速率。
outflow 网络每秒的写入速率。
used_memory Redis使用其分配器分配的总字节数。
mem_usage 内存利用率。
Redis 基本指标 avg_rt Redis平均响应时间。
max_rt Redis最大响应时间。
proxy.avg_rt Redis代理节点平均响应时间。
proxy.max_rt Redis代理节点最大响应时间。
proxy.connection_usage Redis代理连接使用率。
cpu_usage Redis进程CPU使用率。
Keys指标 evicted_keys 由于最大内存限制而逐出的Key数。
total_keys 数据库中的Key总数之和。
expired_keys Key过期事件总数。
Redis Keys hit 命中Keys。
miss 未命中Keys。
表 3. 云数据库MongoDB版和自建MongoDB监控指标
参数类型 参数 说明
MongoDB基本指标 opcounters.insert MongoDB每秒Insert。
opcounters.query MongoDB每秒Query。
opcounters.update MongoDB每秒Update。
opcounters.delete MongoDB每秒Delete。
opcounters.command MongoDB每秒Command。
opcounters.getmore MongoDB每秒Getmore。
connections.current MongoDB当前会话。
metrics.cursor.open.total MongoDB当前打开光标计数。
metrics.cursor.timedOut MongoDB超时游标计数。
network.bytesIn MongoDB每秒网络输入字节数。
network.bytesOut MongoDB每秒网络输出字节数。
network.numRequests MongoDB每秒网络请求。
MongoDB服务进程 cpu_usage MongoDB CPU使用率。
mem_usage MongoDB内存使用率。
disk_usage MongoDB磁盘使用率。
表 4. RDS PostgreSQL监控指标
参数类型 参数 说明
主机指标 cpu_sys_ratio PostgreSQL进程的内核态CPU占用率。
cpu_user_ratio PostgreSQL进程的用户态CPU占用率。
cpu_usage PostgreSQL进程的CPU占用率。
mem_usage PostgreSQL进程的内存使用率。
data.r_s data目录所在磁盘读IOPS。
data.iops data目录所在磁盘IOPS。
data.w_s data目录所在磁盘写IOPS。
local_fs_size_total 磁盘总空间。
data.fs.used data目录所在磁盘总体使用量。
data.fs.usage data目录所在磁盘总体使用率。
network_out_io PostgreSQL进程的网络流出流量。
network_io PostgreSQL进程的网络流量。
network_in_io PostgreSQL进程的网络流入流量。
PostgreSQL基础监控 waiting_connection 当前处于等待状态的连接数。
idle_in_transaction 当前处于空闲状态的会话数。
active_session 当前活跃连接数。
total_session 当前连接总数。
tup_inserted 每秒插入记录数。
tup_deleted 每秒删除记录数。
tup_updated 每秒更新记录数。
tup_returned 每秒全表扫描记录数。
tup_fetched 每秒索引扫描回表记录数。
tps PostgreSQL TPS。
xact_rollback 每秒事务回滚数。
xact_commit 每秒事务提交数。
deadlocks 每秒死锁数。
oldest_snapshot 膨胀点,多久以前的垃圾可以被回收。
max_sent_delay PostgreSQL备库发送延迟。
max_replay_delay 备库APPLY延迟。
long_query_5s 当前系统中执行时间大于等于5秒的SQL的数量。
long_query_1s 当前系统中执行时间大于等于1秒的SQL的数量。
long_query_3s 当前系统中执行时间大于等于3秒的SQL的数量。
long_idle_in_transaction_3s 当前系统中,长期(大于等于3秒)处于空闲的事务数量。
long_idle_in_transaction_5s 当前系统中,长期(大于等于5秒)处于空闲的事务数量。
long_idle_in_transaction_1s 当前系统中,长期(大于等于1秒)处于空闲的事务数量。
long_2pc_1s 当前系统中,大于等于1秒未结束的2PC的事务数量。
long_2pc_5s 当前系统中,大于等于5秒未结束的2PC的事务数量。
long_2pc_3s 当前系统中,大于等于3秒未结束的2PC的事务数量。
表 5. RDS SQL Server监控指标
参数类型 参数 说明
SQL Server服务进程 cpu_usage 实例CPU使用率(占操作系统总数)。
db_io 每秒IO请求次数。
db_io_read 每秒读IO请求次数。
db_io_write 每秒写IO请求次数。
other_size 系统空间使用量。
log_size 日志空间使用量。
tmp_size 临时空间使用量。
ins_size 实例总空间使用量。
data_size 数据空间使用量。
数据库指标 qps 平均每秒SQL语句执行次数。
connection_reset 每秒从连接池启动的登录总次数。
active_temp_tables 当前活跃临时表数。
active_session 当前活跃线程数。
active_cursors 当前活跃游标数。
sessions 当前总连接数。
active_transactions 当前活跃事务数。
transactions 平均每秒事务数。
write_transactions 平均每秒写事务数。
read_kb 实例平均每秒钟的输出流量。
write_kb 实例平均每秒钟的输入流量。
基础监控 cache_hit_ratio 高速缓存命中率。
bufferpool 在缓冲区高速缓存中找到而不需要从磁盘中读取的页的百分比。
fullscans 平均每秒全表扫描次数。
autoparam_attempts_per_sec 每秒的自动参数化尝试次数。
forced_parameterizations_per_sec 每秒成功执行的强制参数化次数。
sql_compilations 每秒的SQL编译次数。
unsafe_autoparams_per_sec 每秒不安全的自动参数化尝试次数。
failed_autoparams_per_sec 每秒自动参数化尝试失败次数。
safe_autoparams_per_sec 每秒安全自动参数化尝试次数。
resqlcompilations 每秒语句重新编译的次数。
lazy_writes 每秒写入磁盘的次数。
checkpoint 每秒检查点写入Page数。
logout 每秒登出次数。
logins 每秒登录次数。
locktimeout 每秒超时的锁请求数,包括对NOWAIT锁的请求。
deadlock 每秒死锁发生的次数。
lock_requests_per_sec 每秒请求的新锁和锁转换次数。
lockwaits 每秒调用者等待的锁请求数。
lock_waits 等待锁的进程的统计信息。
latchwaits 每秒未能立即授予闩锁请求次数。
lock_wait_time_ms 平均锁等待时间。
average_latch_wait_time 请求闩锁资源的平均等待时间。
table_lock_escalations_per_sec 表上的锁升级到TABLE或HoBT粒度的次数。
average_lock_wait_time 请求锁资源的平均等待时间。
total_latch_wait_time 锁在最后一秒内的总等待时间。
表 6. PolarDB MySQL监控指标
参数类型 参数 说明
数据库指标 com_delete 平均每秒Delete语句执行次数。
com_insert 平均每秒Insert语句执行次数。
com_replace 平均每秒Replace语句执行次数。
com_select 平均每秒Select语句执行次数。
com_update 平均每秒Update语句执行次数。
qps QPS。
tps TPS。
PolarDB服务进程 cpu_usage 服务进程CPU使用率(200%代表使用2个CPU Core)。
mem_usage 实例内存使用率(占操作系统总数)。
PolarDB Server active_session 当前活跃会话。
total_session 当前全部会话。
output_traffic 平均每秒发送给所有客户端的字节数。
input_traffic 平均每秒从所有客户端接收到的字节数。
InnoDB存储引擎 innodb_data_read InnoDB平均每秒读字节数。
innodb_data_written InnoDB平均每秒写字节数。
innodb_buffer_dirty_ratio InnoDB Buffer Pool脏页比率。
innodb_buffer_read_hit InnoDB Buffer Pool读缓存命中率。
innodb_buffer_use_ratio InnoDB Buffer Pool使用率。
innodb_rows_deleted InnoDB平均每秒删除的行数。
innodb_rows_inserted InnoDB平均每秒插入的行数。
innodb_rows_read InnoDB平均每秒读取的行数。
innodb_rows_updated InnoDB平均每秒更新的行数。
说明 监控指标含义也可以在控制台的监控大盘中单击每个指标后的问号查看。