健康检查功能可以检查阿里云Prometheus监控是否安装成功。如果您发现Prometheus监控无法监控到数据,那么可以根据健康检查结果排查原因。

前提条件

您已完成使用Prometheus监控您的应用或组件的操作步骤,请参见客户端接入概述

功能入口

  1. 登录ARMS控制台
  2. 在左侧导航栏单击Prometheus监控
  3. Prometheus监控页面左上角选择目标地域,然后单击需要查看的K8s集群名称。
  4. 在左侧导航栏单击健康检查

查看健康检查结果

健康检测页面,您可以查看健康检查结果。健康检查结果主要是Prometheus监控各个阶段的运行数据,包括:

  1. Grafana创建情况。
  2. API请求情况。
    说明 自定义创建的Grafana大盘和除K8s集群外的自建集群通过API URL获取数据源。
  3. 容器服务K8s集群运行时状态采集情况。
  4. Prometheus Agent采集条数及详情。
  5. 采集指标对应的采集任务(Job)详情。此项内容可以查看哪些采集任务(Job)是免费或者收费。
  6. 采集指标的数量统计情况。
  7. 获取Promethues Metric的种类数量,以及最近1分钟内的排序结果。

添加废弃指标

如果您想要解决单指标爆炸问题,或者不想监控某些指标,那么可以将其添加为废弃指标。

  1. 健康检测页面,单击右上角的编辑废弃指标
  2. 编辑废弃指标对话框,添加需要废弃的指标名称metricName,多个metricName通过换行隔开。