本文介绍了ARMS应用监控中常见的指标说明。

业务类指标

公共维度

维度名称 维度Key
服务名称 service
服务PID pid
机器IP serverIp
接口 rpc

指标列表

所有访问类型都包含下列指标,执行查询操作时,只需要将$callType替换为具体的访问类型即可。详细的访问类型,请参见服务访问类型及可用维度

例如:需要查询HTTP服务的请求数时, 只需将arms_$callType_requests_count修改为arms_http_requests_count

指标名称 指标 指标类型 采集间隔 单位 维度
总请求数 arms_$callType_requests_count Gauge 15s 不同服务访问类型维度不同,详细信息,请参见服务访问类型及可用维度
错误请求数 arms_$callType_requests_error_count Gauge 15s
总请求耗时 arms_$callType_requests_seconds Gauge 15s
慢请求数 arms_$callType_requests_slow_count Gauge 15s
总请求耗时分位数 arms_$callType_requests_latency_seconds Summary 15s 仅当服务访问类型为HTTP且开启分位数统计的情况下存在。

quantile分数位维度:

  • 0.5
  • 0.75
  • 0.90
  • 0.99

JVM指标

公共维度

维度名称 维度Key
服务名称 service
服务PID pid
机器IP serverIp

指标列表

指标名称 指标 指标类型 采集间隔 单位 维度
累计GC发生次数 arms_jvm_gc_total Counter 15s gen gc发生区域:
  • young:年轻代
  • old:老年代
累计GC耗时 arms_jvm_gc_seconds_total Counter 15s
两次采集间隔之间的GC次数 arms_jvm_gc_delta Gauge 15s
两次采集间隔之间的GC耗时 arms_jvm_gc_seconds_delta Gauge 15s
JVM线程数 arms_jvm_threads_count Gauge 15s state线程状态:
  • blocked:阻塞状态
  • live:活跃状态
  • daemon:守护状态
  • new:初始状态
  • dead-lock:死锁状态
  • runnable:运行状态
  • terminated:终止状态
  • timed-wait:超时等待状态
  • wait:等待状态
JVM内存区域初始大小 arms_jvm_mem_init_bytes Gauge 15s 字节 area区域:
  • heap:堆区
  • nonheap:非堆区
  • total:总计

id区域细分:

  • eden:伊甸区
  • old:老年代
  • survivor:幸存者区
  • metaspace:元数据区
  • code cache:代码缓存区
  • compressed class space
  • total:总计
JVM内存区域最大大小 arms_jvm_mem_max_bytes Gauge 15s 字节
JVM内存区域使用大小 arms_jvm_mem_used_bytes Gauge 15s 字节
JVM内存区域已提交大小 arms_jvm_mem_committed_bytes Gauge 15s 字节
JVM内存区域使用比例 arms_jvm_mem_usage_ratio Gauge 15s 比例(0~1)
JVM已加载类 arms_class_load_loaded Counter 15s
JVM已卸载类 arms_class_load_un_loaded Counter 15s
JVM缓存池大小 arms_jvm_buffer_pool_total_bytes Gauge 15s 字节 id区域:
  • direct
  • mapped
JVM缓存池已使用大小 arms_jvm_buffer_pool_used_bytes Gauge 15s 字节
JVM缓存池个数 arms_jvm_buffer_pool_count Gauge 15s
文件描述符打开个数 arms_file_desc_open_count Gauge 15s
文件描述符打开比例(已打开数/最大允许打开数) arms_file_desc_open_ratio Gauge 15s 比例(0~1)

系统指标

公共维度

维度名称 维度Key
服务名称 service
服务PID pid
机器IP serverIp

指标列表

指标名称 指标 指标类型 采集间隔 单位
空闲CPU占比 arms_system_cpu_idle Gauge 15s 百分数
IO等待CPU占比 arms_system_cpu_io_wait Gauge 15s 百分数
系统CPU占比 arms_system_cpu_system Gauge 15s 百分数
用户态CPU占比 arms_system_cpu_user Gauge 15s 百分数
系统负载(1分钟) arms_system_load Gauge 15s
磁盘空闲大小 arms_system_disk_free_bytes Gauge 15s 字节
磁盘总大小 arms_system_disk_total_bytes Gauge 15s 字节
磁盘使用率 arms_system_disk_used_ratio Gauge 15s 比例(0~1)
内存Buffer大小 arms_system_mem_buffers_bytes Gauge 15s 字节
内存缓存大小 arms_system_mem_cached_bytes Gauge 15s 字节
内存空闲大小 arms_system_mem_free_bytes Gauge 15s 字节
内存交换区空闲大小 arms_system_mem_swap_free_bytes Gauge 15s 字节
内存交换区大小 arms_system_mem_swap_total_bytes Gauge 15s 字节
内存大小 arms_system_mem_total_bytes Gauge 15s 字节
已用内存大小 arms_system_mem_used_bytes Gauge 15s 字节
网络接收流量大小 arms_system_net_in_bytes Gauge 15s 字节
网口发送流量大小 arms_system_net_out_bytes Gauge 15s 字节
网络入口错误数 arms_system_net_in_err Gauge 15s
网络出口错误数 arms_system_net_out_err Gauge 15s

线程池指标

公共维度

维度名称 维度Key
服务名称 service
服务PID pid
机器IP serverIp
线程池名称 name
线程池类型 type

指标列表

指标名称 指标 指标类型 采集间隔 维度
线程池核心线程数 arms_threadpool_core_size Gauge 15s
线程池最大线程数 arms_threadpool_max_size Gauge 15s
线程池活跃线程数 arms_threadpool_active_size Gauge 15s
线程池队列大小 arms_threadpool_queue_size Gauge 15s
线程池当前大小 arms_threadpool_current_size Gauge 15s
线程池不同状态任务数 arms_threadpool_task_total Gauge 15s
  • status:任务状态
  • scheduled:已调度
  • completed:完成
  • rejected:拒绝

服务访问类型及可用维度

客户端类

  • 访问类型
    • http_client
    • hsf_client
    • mq_client
    • kafka_send
    • notify_client
    • dubbo_client
    • grpc_client
    • thrift_client
  • 维度
    • parent:上游服务的名称
    • ppid:上游服务PID
    • destId:请求对端扩展信息
    • endpoint:请求对端地址
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • stackTraceId:异常栈ID

DB类

  • 访问类型
    • mysql
    • oracle
    • mariadb
    • postgresql
    • ppas
    • sqlserver
    • mongodb
    • dmdb
  • 维度
    • parent:上游服务的名称
    • ppid:上游服务PID
    • destId:数据库名称
    • endpoint:数据库地址
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • stackTraceId:异常栈ID
    • sqlId:SQL语句ID

服务端类

  • 访问类型
    • http
    • hsf
    • dubbo
    • user_method
    • grpc
    • thrift
  • 维度
    • prpc:上游接口
    • parent:上游服务的名称
    • ppid:上游服务PID
    • endpoint:服务地址
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • stackTraceId:异常栈ID

客户端类

  • 访问类型
    • xxl
    • schedulerx
  • 维度
    • prpc:上游接口
    • parent:上游服务的名称
    • ppid:上游服务PID