数据库自治服务DAS(Database Autonomy Service)支持监控大盘功能,您可以自主选择需要监控的数据库实例和指标,对不同数据库实例的指标进行监控对比,并且可以进行多指标联动,帮助您监控数据库实例的运行情况。

前提条件

新增监控大盘

  1. 登录DAS控制台
  2. 在左侧导航栏,单击监控大盘
  3. 自定义大盘页,选择对应的数据库引擎。
  4. 在目标引擎页,单击新增监控大盘
  5. 输入新增监控大盘的名称,单击确定
  6. 单击选择实例和指标,分别选中目标实例和需要查看的指标,并单击‪
    说明
    • 选择目标实例时,最多可同时选择32个实例进行监控。
    • 监控指标的含义请参见监控指标
  7. 单击确认选择即可。
    说明 如果需要修改大盘中的实例或指标,可以单击添加实例和监控指标进行修改。

查看监控大盘中目标实例的指标趋势

  1. 登录DAS控制台
  2. 在左侧导航栏,单击监控大盘
  3. 自定义大盘页,选择对应的数据库引擎。
  4. 在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。
    选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过7天。
    说明 对于Redis数据库实例,查询开始时间和查询结束时间的间隔不能超过3小时。
    • 通过实例筛选,您可以选择多个实例,对比查看其监控指标。
    • 打开自动刷新,系统将以5秒为周期,刷新监控指标趋势图。
    • 打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。
    • 通过图表布局,您可以设置每行显示监控指标趋势图的数量。
    • 单击添加实例和监控指标,修改大盘中的实例或监控指标。
    • 单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。
    • 单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。

监控指标

表 1. RDS MySQL和自建MySQL监控指标
参数类型参数说明
MySQL ServertpsTPS。
qpsQPS。
active_session当前活跃会话。
total_session当前全部会话。
delete_ps平均每秒Delete语句执行次数。
insert_ps平均每秒Insert语句执行次数。
replace_ps平均每秒Replace语句执行次数。
update_ps平均每秒Update语句执行次数。
select_ps平均每秒Select语句执行次数。
bytes_received平均每秒从所有客户端接收到的字节数。
bytes_sent平均每秒发送给所有客户端的字节数。
iops_usageIOPS利用率。
InnoDB存储引擎innodb_bp_hitInnoDB Buffer Pool读缓存命中率。
innodb_bp_dirty_pctInnoDB Buffer Pool脏页比率。
innodb_bp_usage_pctInnoDB Buffer Pool使用率。
innodb_data_writtenInnoDB平均每秒写字节数。
innodb_data_readInnoDB平均每秒读字节数。
innodb_rows_deletedInnoDB平均每秒删除的行数。
innodb_rows_readInnoDB平均每秒读取的行数。
innodb_rows_insertedInnoDB平均每秒插入的行数。
innodb_rows_updatedInnoDB平均每秒更新的行数。
MySQL服务进程cpu_usageMySQL服务进程CPU使用率(阿里云数据库最高100%)。
mem_usageMySQL实例内存使用率(占操作系统总数)。
iopsMySQL读写次数。
disk_usage磁盘使用率。
表 2. 云数据库Redis版和自建Redis监控指标
参数类型参数说明
数据库基本指标instantaneous_ops_per_sec每秒处理的命令数。
get_qps每秒读命令请求数。
put_qps每秒写命令请求数。
connection_usage连接利用率。
inflow网络每秒的读取速率。
outflow网络每秒的写入速率。
used_memoryRedis使用其分配器分配的总字节数。
mem_usage内存利用率。
Redis 基本指标avg_rtRedis平均响应时间。
max_rtRedis最大响应时间。
proxy.avg_rtRedis代理节点平均响应时间。
proxy.max_rtRedis代理节点最大响应时间。
proxy.connection_usageRedis代理连接使用率。
cpu_usageRedis进程CPU使用率。
Keys指标evicted_keys由于最大内存限制而逐出的Key数。
total_keys数据库中的Key总数之和。
expired_keysKey过期事件总数。
Redis Keyshit命中Keys。
miss未命中Keys。
表 3. 云数据库MongoDB版和自建MongoDB监控指标
参数类型参数说明
MongoDB基本指标opcounters.insertMongoDB每秒Insert。
opcounters.queryMongoDB每秒Query。
opcounters.updateMongoDB每秒Update。
opcounters.deleteMongoDB每秒Delete。
opcounters.commandMongoDB每秒Command。
opcounters.getmoreMongoDB每秒Getmore。
connections.currentMongoDB当前会话。
metrics.cursor.open.totalMongoDB当前打开光标计数。
metrics.cursor.timedOutMongoDB超时游标计数。
network.bytesInMongoDB每秒网络输入字节数。
network.bytesOutMongoDB每秒网络输出字节数。
network.numRequestsMongoDB每秒网络请求。
MongoDB服务进程cpu_usageMongoDB CPU使用率。
mem_usageMongoDB内存使用率。
disk_usageMongoDB磁盘使用率。
表 4. RDS PostgreSQL监控指标
参数类型参数说明
主机指标cpu_sys_ratioPostgreSQL进程的内核态CPU占用率。
cpu_user_ratioPostgreSQL进程的用户态CPU占用率。
cpu_usagePostgreSQL进程的CPU占用率。
mem_usagePostgreSQL进程的内存使用率。
data.r_sdata目录所在磁盘读IOPS。
data.iopsdata目录所在磁盘IOPS。
data.w_sdata目录所在磁盘写IOPS。
local_fs_size_total磁盘总空间。
data.fs.useddata目录所在磁盘总体使用量。
data.fs.usagedata目录所在磁盘总体使用率。
network_out_ioPostgreSQL进程的网络流出流量。
network_ioPostgreSQL进程的网络流量。
network_in_ioPostgreSQL进程的网络流入流量。
PostgreSQL基础监控waiting_connection当前处于等待状态的连接数。
idle_in_transaction当前处于空闲状态的会话数。
active_session当前活跃连接数。
total_session当前连接总数。
tup_inserted每秒插入记录数。
tup_deleted每秒删除记录数。
tup_updated每秒更新记录数。
tup_returned每秒全表扫描记录数。
tup_fetched每秒索引扫描回表记录数。
tpsPostgreSQL TPS。
xact_rollback每秒事务回滚数。
xact_commit每秒事务提交数。
deadlocks每秒死锁数。
oldest_snapshot膨胀点,多久以前的垃圾可以被回收。
max_sent_delayPostgreSQL备库发送延迟。
max_replay_delay备库APPLY延迟。
long_query_5s当前系统中执行时间大于等于5秒的SQL的数量。
long_query_1s当前系统中执行时间大于等于1秒的SQL的数量。
long_query_3s当前系统中执行时间大于等于3秒的SQL的数量。
long_idle_in_transaction_3s当前系统中,长期(大于等于3秒)处于空闲的事务数量。
long_idle_in_transaction_5s当前系统中,长期(大于等于5秒)处于空闲的事务数量。
long_idle_in_transaction_1s当前系统中,长期(大于等于1秒)处于空闲的事务数量。
long_2pc_1s当前系统中,大于等于1秒未结束的2PC的事务数量。
long_2pc_5s当前系统中,大于等于5秒未结束的2PC的事务数量。
long_2pc_3s当前系统中,大于等于3秒未结束的2PC的事务数量。
表 5. RDS SQL Server监控指标
参数类型参数说明
SQL Server服务进程cpu_usage实例CPU使用率(占操作系统总数)。
db_io每秒IO请求次数。
db_io_read每秒读IO请求次数。
db_io_write每秒写IO请求次数。
other_size系统空间使用量。
log_size日志空间使用量。
tmp_size临时空间使用量。
ins_size实例总空间使用量。
data_size数据空间使用量。
数据库指标qps平均每秒SQL语句执行次数。
connection_reset每秒从连接池启动的登录总次数。
active_temp_tables当前活跃临时表数。
active_session当前活跃线程数。
active_cursors当前活跃游标数。
sessions当前总连接数。
active_transactions当前活跃事务数。
transactions平均每秒事务数。
write_transactions平均每秒写事务数。
read_kb实例平均每秒钟的输出流量。
write_kb实例平均每秒钟的输入流量。
基础监控cache_hit_ratio高速缓存命中率。
bufferpool在缓冲区高速缓存中找到而不需要从磁盘中读取的页的百分比。
fullscans平均每秒全表扫描次数。
autoparam_attempts_per_sec每秒的自动参数化尝试次数。
forced_parameterizations_per_sec每秒成功执行的强制参数化次数。
sql_compilations每秒的SQL编译次数。
unsafe_autoparams_per_sec每秒不安全的自动参数化尝试次数。
failed_autoparams_per_sec每秒自动参数化尝试失败次数。
safe_autoparams_per_sec每秒安全自动参数化尝试次数。
resqlcompilations每秒语句重新编译的次数。
lazy_writes每秒写入磁盘的次数。
checkpoint每秒检查点写入Page数。
logout每秒登出次数。
logins每秒登录次数。
locktimeout每秒超时的锁请求数,包括对NOWAIT锁的请求。
deadlock每秒死锁发生的次数。
lock_requests_per_sec每秒请求的新锁和锁转换次数。
lockwaits每秒调用者等待的锁请求数。
lock_waits等待锁的进程的统计信息。
latchwaits每秒未能立即授予闩锁请求次数。
lock_wait_time_ms平均锁等待时间。
average_latch_wait_time请求闩锁资源的平均等待时间。
table_lock_escalations_per_sec表上的锁升级到TABLE或HoBT粒度的次数。
average_lock_wait_time请求锁资源的平均等待时间。
total_latch_wait_time锁在最后一秒内的总等待时间。
表 6. PolarDB MySQL版监控指标
参数类型参数说明
数据库指标com_delete平均每秒Delete语句执行次数。
com_insert平均每秒Insert语句执行次数。
com_replace平均每秒Replace语句执行次数。
com_select平均每秒Select语句执行次数。
com_update平均每秒Update语句执行次数。
qpsQPS。
tpsTPS。
PolarDB服务进程cpu_usage服务进程CPU使用率(200%代表使用2个CPU Core)。
mem_usage实例内存使用率(占操作系统总数)。
PolarDB Serveractive_session当前活跃会话。
total_session当前全部会话。
output_traffic平均每秒发送给所有客户端的字节数。
input_traffic平均每秒从所有客户端接收到的字节数。
InnoDB存储引擎innodb_data_readInnoDB平均每秒读字节数。
innodb_data_writtenInnoDB平均每秒写字节数。
innodb_buffer_dirty_ratioInnoDB Buffer Pool脏页比率。
innodb_buffer_read_hitInnoDB Buffer Pool读缓存命中率。
innodb_buffer_use_ratioInnoDB Buffer Pool使用率。
innodb_rows_deletedInnoDB平均每秒删除的行数。
innodb_rows_insertedInnoDB平均每秒插入的行数。
innodb_rows_readInnoDB平均每秒读取的行数。
innodb_rows_updatedInnoDB平均每秒更新的行数。
说明 监控指标含义也可以在控制台的监控大盘中单击每个指标后的问号查看。