事件监控是为您提供的查询管控ENS边缘算力系统事件的平台服务。通过事件监控有计划或非预期变动时的告知机制,帮助您明确知晓ENS的使用状态。
所有事件类报警均按照实例触发,即同一个事件,如果影响三台实例,则会触发三个事件。
目前支持通过云监控接入ENS系统事件,详细信息,请参见云服务事件、创建系统事件报警规则。
事件列表
事件名称 | 事件定义 | 事件状态 |
---|---|---|
实例重启 | 因系统因素导致的重启。 | 执行、完成 |
实例创建 | 实例创建完成。 | 完成 |
实例删除 | 实例释放完成。 | 完成 |
节点网络割接 | 边缘节点定期网络设备维护,一般半夜执行,可能存在网络抖动或网络中断。 | 计划、执行、完成 |
节点网络 | 边缘节点意料之外的网络中断。 | 失联、恢复 |
事件级别 | 描述 |
---|---|
CRITICAL | 严重 |
WARN | 警告 |
INFO | 消息 |
事件类型 | 描述 |
---|---|
Executing | 事件正在发生的或已经发生。 |
Executed | 事件已经完成或已经恢复。 |
Scheduled | 事件计划,一般提前发送通知。 |
Canceled | 取消计划。 |
实例重启执行
类型 | 描述 |
---|---|
事件描述 | 实例重启执行中(系统问题导致)。 |
事件名称 | Instance:SystemFailure.Reboot:Executing。 |
事件级别 | CRITICAL。 |
事件类型 | Executing。 |
状态 | Executing。 |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"reason":"nc_network_error",//重启原因
"errorTime":"2019-04-17 20:20:50",//发生时间
"resumeTime":"",//恢复时间
"internetIP":"117.34.xx.xx",//实例IP
"instanceId":"i-5hl5z85eo4eyj96zbls8****",//实例ID
"level":"CRITICAL",//事件级别
"regionId":"cn-xian-telecom",//节点ID
"regionName":"西安电信",//节点名称
"eventName":"Instance:SystemFailure.Reboot:Executing",//事件名称
"status":"Executing",//事件状态
"timestamp":1555503650000//上报时间戳
}
实例重启完成
类型 | 描述 |
---|---|
事件描述 | 实例重启完成(系统问题导致)。 |
事件名称 | Instance:SystemFailure.Reboot:Executed。 |
事件级别 | INFO。 |
事件类型 | Executed。 |
状态 | Executed。 |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"reason":"nc_network_error",//重启原因
"errorTime":"2019-04-17 20:20:50",//发生时间
"resumeTime":"2019-04-17 20:22:49",//恢复时间
"internetIP":"117.34.xx.xx",//实例IP
"instanceId":"i-5hl5z85eo4eyj96zbls****",//实例ID
"level":"INFO",//事件级别
"regionId":"cn-xian-telecom",//节点ID
"regionName":"西安电信",//节点名称
"eventName":"Instance:SystemFailure.Reboot:Executed",//事件名称
"status":"Executed",//事件状态
"timestamp":1555503650000//上报时间戳
}
实例创建完成
类型 | 描述 |
---|---|
事件描述 | 实例创建完成。 |
事件名称 | EnsInstance:Create:Executed。 |
事件级别 | CRITICAL。 |
事件类型 | Executed。 |
状态 | Executed。 |
通知数据 | 通过接口回调,返回一个JSON字符串。 |
数据字段说明如下所示。
{
"regionId": "cn-xian-telecom", //节点ID
"level": "CRITICAL", //事件级别
"instances": //短时间内同一个节点创建的实例列表
[
{
"instanceId": "i-5it52o4t259piz1u6ef****", //实例ID
"internetIp": [ "117.27.xx.xx" ], //实例IP列表
"operateTime": "2020-04-08 20:06:35" //创建时间
}
],
"regionName": "西安电信", //节点名称
"eventName": "EnsInstance:Create:Executed", //事件名称
"status": "Executed", //事件状态
"timestamp": 1586347660000 //时间戳,毫秒
}
实例删除完成
类型 | 描述 |
---|---|
事件描述 | 实例删除完成。 |
事件名称 | EnsInstance:Delete:Executed |
事件级别 | CRITICAL |
事件类型 | Executed |
状态 | Executed |
通知数据 | 通过接口回调,返回一个JSON串。 |
数据字段说明如下所示。
{
"regionId": "cn-xian-telecom", //节点ID
"level": "CRITICAL", //事件级别
"instances": //短时间内同一个节点删除的实例列表
[
{
"instanceId": "i-5it52o4t259piz1u6ef5****", //实例ID
"internetIp": [ "117.27.xx.xx" ], //实例IP列表
"operateTime": "2020-04-08 20:06:35" //删除时间
}
],
"regionName": "西安电信", //节点名称
"eventName": "EnsInstance:Create:Executed", //事件名称
"status": "Executed", //事件状态
"timestamp": 1586347660000 //时间戳,毫秒
}
节点网络割接计划
网络割接计划一般提前24小时以上通知,仅紧急通知的情况下会小于24小时。
类型 | 描述 |
---|---|
事件描述 | 边缘节点网络割接计划。 |
事件名称 | EnsRegion:NetworkMigration:Scheduled |
事件级别 | WARN |
事件类型 | Scheduled |
状态 | Scheduled |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"networkMigrationEventId":-50,//网络割接事件ID,一次网络割接如果影响3个实例,则这三次事件的ID均是同一个
"instanceId":"i-5hlabsavg39f5hlnkk2f3928z",//影响实例ID
"internetIp":"117.34.xx.xx",//影响实例IP
"regionId":"cn-xian-telecom",//网络割接节点ID
"level":"WARN",//事件级别
"regionName":"西安电信",//网络割接节点名称
"startTime":1555588800000,//割接计划开始时间
"endTime":1555592400000,//割接计划结束时间
"aliUid":"108131418885****",//用户ID
"event":"EnsRegion:NetworkMigration:Scheduled",//事件名称
"status":"Scheduled"//事件状态
}
节点网络割接执行
网络割接开始时通知,一般会提前几分钟(0~5分钟)发送事件。
类型 | 描述 |
---|---|
事件描述 | 边缘节点网络割接执行。 |
事件名称 | EnsRegion:NetworkMigration:Executing |
事件级别 | CRITICAL |
事件类型 | Executing |
状态 | Executing |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"networkMigrationEventId":-50,//网络割接事件ID,一次网络割接如果影响3个实例,则这三次事件的ID均是同一个
"instanceId":"i-5hlabsavg39f5hlnkk2f****",//影响实例ID
"internetIp":"117.34.xx.xx",//影响实例IP
"regionId":"cn-xian-telecom",//网络割接节点ID
"level":"CRITICAL",//事件级别
"regionName":"西安电信",//网络割接节点名称
"startTime":1555588800000,//割接计划开始时间
"endTime":1555592400000,//割接计划结束时间
"aliUid":"108131418885****",//用户ID
"event":"EnsRegion:NetworkMigration:Executing",//事件名称
"status":"Executing"//事件状态
}
节点网络割接完成
网络割接完成时触发。在网络割接实际完成时,运营商不会发通知,所以只有计划完成时间。
类型 | 描述 |
---|---|
事件描述 | 边缘节点网络割接完成。 |
事件名称 | EnsRegion:NetworkMigration:Executed |
事件级别 | INFO |
事件类型 | Executed |
状态 | Executed |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"networkMigrationEventId":-50,//网络割接事件ID,一次网络割接如果影响3个实例,则这三次事件的ID均是同一个
"instanceId":"i-5hlabsavg39f5hlnkk2****",//影响实例ID
"internetIp":"117.34.xx.xx",//影响实例IP
"regionId":"cn-xian-telecom",//网络割接节点ID
"level":"INFO",//事件级别
"regionName":"西安电信",//网络割接节点名称
"startTime":1555588800000,//割接计划开始时间
"endTime":1555592400000,//割接计划结束时间
"aliUid":"108131418885****",//用户ID
"event":"EnsRegion:NetworkMigration:Executed",//事件名称
"status":"Executed"//事件状态
}
节点网络失联
当ENS自身管控系统网络探测程序发现某节点网络不通的情况下,会触发节点网络失联的事件。
类型 | 描述 |
---|---|
事件描述 | 节点网络失联。 |
事件名称 | EnsRegion:NetworkDown:Executing |
事件级别 | CRITICAL |
事件类型 | Executing |
状态 | Executing |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"reason":"rg_network_down", //事件触发原因,节点网络失联仅有该原因
"errorTime":"2019-04-19 16:48:12",//发生时间
"resumeTime":"",//恢复时间
"internetIP":"117.34.xx.xx",//实例IP
"instanceId":"i-5hlabsavg39f5hlnk****",//实例ID
"level":"CRITICAL",//事件级别
"regionId":"cn-xian-telecom",//节点ID
"regionName":"西安电信",//节点名称
"eventName":"EnsRegion:NetworkDown:Executing",//事件名称
"status":"Executing",//事件状态
"timestamp":1555663692000//时间戳
}
节点网络恢复
当ENS自身管控系统网络探测程序发现失联节点有一台或多台实例网络恢复时,会触发节点网络恢复的事件。
类型 | 描述 |
---|---|
事件描述 | 节点网络恢复。 |
事件名称 | EnsRegion:NetworkDown:Executed |
事件级别 | CRITICAL |
事件类型 | Executed |
状态 | Executed |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"reason":"rg_network_down",//事件触发原因,节点网络失联仅有该原因
"errorTime":"2019-04-19 16:48:12",//发生时间
"resumeTime":"2019-04-19 16:52:01",//恢复时间
"internetIP":"117.34.xx.xx",//实例IP
"instanceId":"i-5hlabsavg39f5hlnkk2f****",//实例ID
"level":"INFO",//事件级别
"regionId":"cn-xian-telecom",//节点ID
"regionName":"西安电信",//节点名称
"eventName":"EnsRegion:NetworkDown:Executed",//事件名称
"status":"Executed",//事件状态
"timestamp":1555663921000//时间戳
}
节点网络水位异常
当ENS节点水位过高时,会触发节点网络水位异常事件。
类型 | 描述 |
---|---|
事件描述 | 节点网络水位异常。 |
事件名称 | EnsRegion:NetworkWaterLevel:Executing |
事件级别 | WARN |
事件类型 | Executing |
状态 | Executing |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"reason":"节点网络水位过高",
"level":"WARN", //事件级别
"instances":[
{
"instanceId":"i-xxxxxxxxxxxxxxxxxxxxxxxxx",
"instanceIp":"14.xx.xx.xx"
},
{
"instanceId":"i-xxxxxxxxxxxxxxxxxxxxxxxxx",
"instanceIp":"14.xx.xx.x"
}
], //影响实例列表
"regionName":"昆明联通",
"networkWaterLevelEventId":12345,
"regionId":"cn-kunming-unicom",
"startTimeFmt":"2020-07-13 15:30:00",
"eventName":"EnsRegion:NetworkWaterLevel:Executing",
"startTime":1594625400, //问题开始时间
"endTime":0, //问题结束时间,针对EnsRegion:NetworkWaterLevel:Executing事件结束时间为0
"endTimeFmt":"1970-01-01 08:00:00",
"timestamp":1594625489000,
"status":"Executing"
}
节点网络水位恢复
当ENS监控到节点水位恢复时,会触发节点网络水位恢复的事件。
类型 | 描述 |
---|---|
事件描述 | 节点网络水位恢复。 |
事件名称 | EnsRegion:NetworkWaterLevel:Executed |
事件级别 | WARN |
事件类型 | Executed |
状态 | Executed |
通知数据 | 通过接口回调,返回JSON字符串。 |
数据字段说明如下所示。
{
"reason":"节点网络水位过高",
"level":"WARN", //事件级别
"instances":[
{
"instanceId":"i-xxxxxxxxxxxxxxxxxxxxxxxxx",
"instanceIp":"14.xx.xx.xx"
},
{
"instanceId":"i-xxxxxxxxxxxxxxxxxxxxxxxxx",
"instanceIp":"14.xx.xx.x"
}
], //影响实例列表
"regionName":"昆明联通",
"networkWaterLevelEventId":12345,
"regionId":"cn-kunming-unicom",
"startTimeFmt":"2020-07-13 15:30:00",
"eventName":"EnsRegion:NetworkWaterLevel:Executed",
"startTime":1594625400, //问题开始时间
"endTime":1594625700, //问题结束时间
"endTimeFmt":"2020-07-13 15:35:00",
"timestamp":1594625648000,
"status":"Executed"
}