阿里云Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,覆盖绝大部分开源基础设施软件指标采集能力。提供多种开箱即用的预置监控大盘,并集成丰富的Kubernetes基础监控以及常用服务预设看板,且提供全面托管的Prometheus服务。阿里云Prometheus监控的优势包含以下几点。

开箱即用

  • 一键安装部署即可监控Kubernetes以及各类云产品。
  • 一键接入各种应用组件及告警工具。
  • 扩增主动健康巡检、Agent升级、白屏化配置、云产品集成等场景功能,强化运维监控能力。

低成本

  • 多种指标免费用,覆盖Kubernetes标准组件。
  • 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。
  • 与阿里云容器服务ACK集成并提供监控服务,容器监控体系创建时间从3天降低至10分钟。

开源兼容

  • 兼容标准开源Prometheus.yaml采集规则配置文件、适合自定义Kubernetes内监控采集规则ServiceMonitor、默认采集规则Annotation。
  • 支持自定义多维数据模型、HTTP API模块、PromQL查询。
  • 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。

数据规模无上限

  • 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。
  • 通过Global DataSource和Global View实现对多套Kubernetes集群的统一监控,用户可以实现跨Kubernetes集群的聚合查询。

高性能

  • 相较开源版本结构更轻量,资源消耗更低。通过单进程一体化Agent监控Kubernetes集群,采集性能提升20倍。
  • Agent部署在用户侧,保留原生采集能力同时能够最大程度的减少资源的使用。
  • 通过采集存储分离架构,全面提升整体性能。
  • 采集组件优化,提升单副本采集能力,降低资源消耗。
  • 通过多副本横向扩展均衡分解采集任务,实现动态扩缩,解决开源水平扩展问题。

高可用性

  • 双副本:数据采集、处理和存储组件支持多副本横向扩展,保证核心数据链路高可用。
  • 水平扩展:基于集群规模可直接进行弹性扩容。
  • 数据重传:支持数据自动重传,彻底解决丢弃逻辑弊病,确保数据完整性与准确性。

阿里云Prometheus监控与开源Prometheus对比

优势对比项 阿里云Prometheus监控 开源Prometheus
购买资源和系统搭建 阿里云全托管 自行购买相关资源并部署系统
运维成本 免运维 日常自行运维
高可用性 支持采集存储组件多副本,可水平扩展 单进程,无法水平扩展
数据接入 一键接入常见云产品,覆盖数据库、中间件等主流应用组件,以及Java和Go等主流编程语言构建的应用,支持ECS集群中间件的免Agent安装监控 创建对应组件的Exporter,完成数据接入
数据存储 基于云上存储,存储容量无上限 受限于存储容量
数据可视化 内置Grafana,各类常见监控模板开箱即用 需要单独部署Grafana,并自行配置看板
告警管理 集成ARMS告警中心,提升告警效率与精度 自行接入Alertmanager插件
单副本采集性能(2C 4G) 600w 时间点/次 100w 时间点/次
数据查询性能(6亿时间点) 8~10s 180s
安全管理 阿里云安全能力加持,并支持鉴权功能 不支持
其他能力 支持预计算、降采样等能力 不支持