数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。
背景信息
云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务。云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。
提供通过邮件、钉钉机器人的方式,对事件发生进行报警。
提供将事件分发到您的轻量消息队列(原 MNS)、函数计算、URL回调和日志服务中,以便您根据业务场景自动化处理异常事件。
前提条件
您需要登录消息中心,确保云数据库故障或运维通知的通知开关处于开启状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。
创建报警联系人和报警联系组,并将报警联系人添加到报警联系组。具体操作,请参见创建报警联系人或报警联系人组。
创建订阅策略
登录云监控控制台。
在左侧导航栏,选择。
说明若您没有事件订阅页面,相关操作请参见通过云监控平台为DTS任务设置报警规则。
在订阅策略页签,单击创建订阅策略。
在创建订阅策略页面,设置订阅策略的相关参数。
若订阅类型选择为系统事件,您需要在订阅范围中将产品选择为数据传输。
说明DTS支持的系统事件,请参见系统事件。
若订阅类型选择为阈值事件,您需要在产品分类中搜索数据传输服务,并根据实际需求选择。
其余参数请根据业务需求进行选择,请参见订阅策略参数说明。
配置完成后,单击提交。
您需要查看、修改或删除已订阅的云监控事件,操作方法请参见管理事件订阅(推荐)。
调试事件订阅
登录云监控控制台。
在左侧导航栏,选择。
说明若您没有事件订阅页面,相关操作请参见通过云监控平台为DTS任务设置报警规则。
在订阅策略页签,单击调试事件订阅。
在创建事件调试面板,配置调试事件。
将产品选择为数据传输。
根据实际情况,选择名称。
说明名称即为系统事件的NameDesc。
因底层硬件升级腾挪任务(系列)和实例任务延迟不支持调试。
系统将自动生成JSON格式的调试内容。
根据实际情况,修改调试内容。
修改示例,请参见事件内容示例。
单击确定。
系统提示操作成功,云监控自动根据订阅策略中的通知方式给报警联系人发送一条报警测试通知。
事件内容示例
同步、迁移、订阅任务
参数说明
参数 | 说明 | 示例值 |
product | 系统事件所属的云产品(Product)。 |
|
resourceId | 影响的资源。 说明 默认以 |
|
level | 系统事件的等级(Level)。
|
|
instanceName | 影响的实例名称,格式为 |
|
regionId | 实例的地域。 |
|
name | 系统事件的名称(Name)。 |
|
content | 系统事件的内容。 |
|
msg | ||
status | 系统事件的状态(Status)。
|
|
示例
名称 | 内容示例 |
同步任务异常 | |
同步任务恢复 | |
迁移任务异常 | |
迁移任务恢复 | |
订阅任务异常 | |
订阅任务恢复 | |
实例任务
参数说明
参数 | 说明 | 示例值 |
product | 系统事件所属的云产品(Product)。 |
|
resourceId | 影响的资源。 说明 默认以 |
|
level | 系统事件的等级(Level)。 说明 实例任务异常所对应的等级均为WARN(警告)。 |
|
instanceName | 影响的实例名称,格式为 |
|
regionId | 实例的地域。 |
|
name | 系统事件的名称(Name)。 |
|
content | 系统事件的内容。 |
|
eventId | 系统事件的ID。 |
|
publishTime | 系统事件的发布时间(UTC时间)。 |
|
reason | 触发系统事件的原因。 |
|
product | 系统事件所属的云产品。 |
|
instanceComment | 影响的实例ID。 |
|
instanceId | ||
extra | 系统事件内容的额外信息。 |
|
eventTime | 系统事件的开始时间(UTC时间)。 |
|
cloudEvent | 云监控事件信息。 |
|
data | 系统事件的数据概览。 |
|
gmtModified | 更新时间(UTC时间)。 |
|
eventCategory | 事件的分类(EventType)。 说明 实例任务异常所对应的分类均为Exception(异常)。 |
|
gmtCreated | 事件的创建时间(UTC时间)。 |
|
detailReason | 触发事件的详细原因。 |
|
uid | 阿里云账号ID。 |
|
cmsProduct | 事件所属的云产品。 |
|
instanceId | 影响的实例ID。 |
|
eventLevel | 事件的等级(Level)。 说明 实例任务异常所对应的等级均为WARN(警告)。 |
|
handleStatus | 事件的处理状态。 |
|
startTime | 事件的开始时间(UTC时间)。 |
|
detailImpact | 翻页参数。 |
|
eventId | 事件的ID。 |
|
product | 事件所属的云产品。 |
|
dbType | ||
hasLifeCycle | 是否有生命周期。
|
|
eventType | 事件的类型。 |
|
eventReason | 事件的来源。 |
|
eventImpact | 事件的影响。 |
|
mainEventId | 主事件的ID。 |
|
eventCode | 事件的编码,即名称(Name)。 |
|
isClosed | 事件是否关闭。
|
|
regionId | 实例的地域。 |
|
sourceType | 源数据的类型。 |
|
eventStatus | 系统事件的状态(Status)。
|
|
endTime | 事件的结束时间。 |
|
eventDetail | 事件详情,包含任务类型(dts_task_type)、任务ID(dts_job_id)、任务状态(job_state)、错误码(err_code)、任务异常详细信息(err_msg_detail和message)等。 |
|
resourceType | 资源类型。
|
|
subject | 影响的资源。 说明 默认以 |
|
specversion | CloudEvents协议版本。 |
|
time | 事件的创建时间(UTC时间)。 |
|
source | 事件的来源。 |
|
id | 事件的ID。 |
|
region | 实例的地域。 |
|
type | 事件的类型。 |
|
region | 实例的地域。 |
|
instanceType | 资源类型。
|
|
eventType | 事件的分类。 |
|
status | 系统事件的状态(Status)。
|
|
示例
名称 | 内容示例 |
实例任务异常恢复 | |
实例任务异常开始 | |
因底层硬件升级腾挪任务
参数说明
参数 | 说明 | 示例值 |
product | 系统事件所属的云产品(Product)。 |
|
userId | 阿里云账号ID。 |
|
level | 系统事件的等级(Level)。
|
|
resourceId | 影响的资源。 说明 默认以 |
|
instanceName | 影响的实例名称,格式为 |
|
dryRun | 是否只预检请求。
|
|
ver | CloudEvents协议版本。 |
|
trace | 请求ID。 |
|
name | 系统事件的名称(Name)。 |
|
regionId | 实例的地域。 |
|
status | 系统事件的状态(Status)。
|
|
time | 系统事件的产生时间。 |
|
content | 系统事件的内容。 说明 可以包含任务或实例名称(jobName)、系统事件的预计执行时间(innerScheduleTime)、实例ID(instanceId)、实例地域(region)等信息。 |
|
示例
名称 | 内容示例 |
因底层硬件升级腾挪任务(计划中) | |
因底层硬件升级腾挪任务(执行中) | |
因底层硬件升级腾挪任务(已完成) | |
因底层硬件升级腾挪任务(执行失败) | |
因底层硬件升级腾挪任务(已取消) | |
因底层硬件升级腾挪任务(待客户处理) | |