云监控服务具有监控数据收集、可视化和实时监控报警等功能。后台云监控会根据您配置的报警规则,判断资源的使用是否超过配置的阈值。如果超过,则通过邮件、钉钉机器人等方式通知相应的联系人,以便及时处理异常消息。本文介绍如何为消息队列RocketMQ版上的资源创建报警规则。
云监控服务的详细信息,请参见云产品监控。
说明 通过HTTP协议收发消息所使用的资源,暂不支持消息堆积相关的监控报警。
步骤一:创建服务关联角色
首次使用云监控提供的监控报警功能时,消息队列RocketMQ版会自动为您创建服务关联角色AliyunServiceRoleForOns,以此访问云监控的云资源。消息队列RocketMQ版服务关联角色的详细信息,请参见服务关联角色。
- 登录消息队列RocketMQ版控制台。
- 在左侧导航栏,单击实例列表。
- 在顶部菜单栏,选择地域,如华东1(杭州)。
- 在实例列表页面,找到目标实例,在其操作列,单击详情。
- 在左侧导航栏,单击监控报警。
- 在服务关联角色对话框,单击确定。
步骤二:查看监控报表信息
- 登录消息队列RocketMQ版控制台。
- 在左侧导航栏,单击实例列表。
- 在顶部菜单栏,选择地域,如华东1(杭州)。
- 在实例列表页面,找到目标实例,在其操作列,单击详情。
- 在左侧导航栏,单击监控报警,并选择需要查看监控数据的资源。

- 如需查看实例的报警信息,请选择。示例如下。

- 如需查看Topic的报警信息,请选择。示例如下。

- 如需查看Group ID的报警信息,请选择。示例如下。

说明
消息堆积(个)
此监控项表示该Group ID下所堆积的消息数量。消息堆积的详细信息,请参见名词解释。
您可以选择查看最近1小时、3小时、6小时、12小时、1天、3天、7天或14天的数据,也可以单击最右端的时间选择框,自定义要查看的时间段。
若您要自定义时间段,最长能查看最近31天的数据(超过31天的数据不保留),即时间选择框中的结束时间为当前系统时间,而开始时间最早可为31天前。若结束时间不是当前系统时间,则可查看31天内最长任意7天的数据。
步骤三:设置报警规则
- 登录消息队列RocketMQ版控制台。
- 在左侧导航栏,单击实例列表。
- 在顶部菜单栏,选择地域,如华东1(杭州)。
- 在实例列表页面,找到目标实例,在其操作列,单击详情。
- 在左侧导航栏,单击监控报警。
- 在监控报警页面左上角,单击配置报警规则。
- 在创建报警规则页面,设置报警规则和通知方式,详细信息,请参见创建报警规则。

消息队列RocketMQ版监控项说明如下表所示。
说明 已就绪消息量和
已就绪消息排队时间指标的详细说明,请参见
相关概念。
监控项 |
单位 |
MetricName |
Dimensions |
Statistics |
消息堆积 |
Count |
ConsumerLag |
userId、instanceId、groupId |
Sum |
消息堆积(GroupID&Topic) |
Count |
ConsumerLagPerGidTopic |
userId、instanceId、groupId、topic |
Sum |
实例API调用频率 |
Count/s |
InstanceApiCallTps |
userId、instanceId |
Sum |
消息保留时长 |
Hour |
MessageRetentionPeriod |
userId、instanceId |
Minimum |
已就绪消息排队时间(GroupId) |
Millisecond |
ReadyMessageQueueTime |
userId、instanceId、groupId |
Maximum |
已就绪消息排队时间(GroupId&Topic) |
Millisecond |
ReadyMessageQueueTimePerGidTopic |
userId、instanceId、groupId、topic |
Maximum |
已就绪消息量(GroupId) |
Count |
ReadyMessages |
userId、instanceId、groupId |
Sum |
已就绪消息量(GroupId&Topic) |
Count |
ReadyMessagesPerGidTopic |
userId、instanceId、groupId、topic |
Sum |
Consumer(GroupId) 每分钟接收消息数量 |
Count/min |
ReceiveMessageCountPerGid |
userId、instanceId、groupId |
Sum |
Consumer(GroupId&Topic) 每分钟接收消息数量 |
Count/min |
ReceiveMessageCountPerGidTopic |
userId、instanceId、topic、groupId |
Sum |
实例(Instance) 每分钟接收消息数的数量 |
Count/min |
ReceiveMessageCountPerInstance |
userId、instanceId |
Sum |
Consumer(Topic) 每分钟接收消息的数量 |
Count/min |
ReceiveMessageCountPerTopic |
userId、instanceId、topic |
Sum |
每分钟产生死信消息的数量(GroupId) |
Count/min |
SendDLQMessageCountPerGid |
userId、instanceId、groupId |
Sum |
每分钟产生死信消息的数量(GroupId&Topic) |
Count/min |
SendDLQMessageCountPerGidTopic |
userId、instanceId、groupId、topic |
Sum |
Producer(GroupId) 每分钟发送消息的数量 |
Count/min |
SendMessageCountPerGid |
userId、instanceId、groupId |
Sum |
Producer(GroupId&Topic) 每分钟发送消息数量 |
Count/min |
SendMessageCountPerGidTopic |
userId、instanceId、topic、groupId |
Sum |
实例(Instance) 每分钟发送消息数量 |
Count/min |
SendMessageCountPerInstance |
userId、instanceId |
Sum |
Producer(Topic) 每分钟发送消息数量 |
Count/min |
SendMessageCountPerTopic |
userId、instanceId、topic |
Sum |
在相应资源的操作列,单击报警规则,您可以查看到刚创建的报警规则信息。