本文为您介绍实时计算监控报警的操作流程以及报警规则的创建步骤。
什么是云监控报警服务
云监控服务能够收集阿里云资源或您自定义的监控指标、探测服务可用性以及针对指标设置警报,让您全面了解阿里云上的资源使用情况、业务的运行状况和健康度,并及时接收异常报警,保证应用程序顺畅运行。
创建报警规则
创建报警规则详情,参见设置报警规则。实时计算Flink版监控项
监控项 | 单位 | Metric | Dimensions | Statistics |
---|---|---|---|---|
业务延迟(s) | s | inputDelay | userId、regionId、projectName、jobName | Average |
读入RPS(RPS) | RPS | ParserTpsRate | userId、regionId、projectName、jobName | Average |
写出RPS(RPS) | RPS | SinkOutTpsRate | userId、regionId、projectName、jobName | Average |
FailoverRate(%)
说明 Failover Rate表示最近1分钟平均每秒Failover的次数。例如,最近1分钟Failover了1次,则Failover Rate=1/60=0.01667。
|
% | TaskFailoverRate | userId、regionId、projectName、jobName | Average |
处理延迟(s) | s | FetchedDelay | userId、regionId、projectName、jobName | Average |
查看监控报警信息
- 登录实时计算控制台。
- 单击页面顶部的运维。
- 在运维界面,单击目标作业名称。
- 在页面右上角,单击 。
- 在监控图标页面,查看作业的监控指标。