如果您希望实时掌握Kafka资源(实例、Topic、Group)状态,监控资源数据是否超过阈值,您可以使用云监控实时监测您账户下创建的资源。您还可以为云监控项设置报警规则,当监控项数据超过设定的报警阈值时,云监控可以通过电话、短信、邮件、钉钉机器人等方式通知您,帮助您及时应对异常情况。
监控项
监控项的数据聚合周期为1分钟,即1分钟计算一次,计算出来每秒多少字节。您可以将该数据理解为一分钟内的平均值。
监控项的数据延时1分钟。
针对各资源类型提供的监控项如下:
资源类型 | 监控项 | 单位 |
实例 | 消息生产流量 | Bytes/s |
实例消息消费流量 | Bytes/s | |
实例磁盘使用率 说明 实例磁盘使用率(%)显示的是实例各节点中磁盘使用率的最大值。 | % | |
实例公网写入带宽 | bit/s | |
实例公网读取带宽 | bit/s | |
Topic | Topic消息生产流量 | Bytes/s |
Topic消息消费流量 | Bytes/s | |
Group | Group未消费消息总数 | 个 |
计费说明
使用云监控功能云消息队列 Kafka 版不收取费用。
前提条件
创建服务关联角色
角色名称:AliyunServiceRoleForAlikafka
角色策略名称:AliyunServiceRolePolicyForAlikafka
权限说明:允许云消息队列 Kafka 版使用该角色访问您的服务(云监控和ARMS服务)以完成云监控相关功能。
具体文档说明:服务关联角色。
查看云监控数据
在概览页面的资源分布区域,选择地域。
在实例列表页面,单击目标实例名称。
在左侧导航栏,选择 。
在云监控页面,单击报警规则页签,单击要查看监控数据的资源页签,找到要查看监控数据的资源,单击其右侧操作列的云监控,设置时间范围,查看监控数据。
设置报警规则
在云监控页面,单击报警规则,选择实例、Topic或Group资源页签,设置报警规则。
页面将跳转至云监控控制台的创建报警规则面板。
在创建报警规则面板按提示设置规则和通知信息,然后单击确定。具体参数设置,请参见创建报警规则。
查看报警信息
在云监控页面,单击报警规则,然后单击要查看报警信息的资源(实例、Topic或Group)页签。
找到具体的资源名称,单击操作列的报警规则。
在关联的报警规则面板,选择目标报警规则,单击其操作列的详情,您可以查看报警规则、禁用或启用报警规则、删除报警规则、查看报警历史。
相关文档
实例的Prometheus监控数据,请参见Prometheus监控。
关于监控报警的更多常见问题,请参见监控报警问题。