本文为您汇总智能监控的相关问题。

不需要接收任务的报警,该如何处理?

一条基线纳入监控后,该基线上的任务及基线上任务的上游的所有任务都会被监控。如果基线上的任务或节点的上游节点影响到基线上受保障的任务的数据产出,则智能监控会生成一个事件,事件默认报警给任务责任人。详情请参见智能监控1
如上图所示,假设整个DataWorks只有6个任务节点,任务D和任务E属于受保障基线上的节点。任务D和任务E及它们所有的上游节点,均会被纳入监控范围。即上图中的任务A、任务B、任务D和任务E出现异常(出错或变慢),也会被智能监控察觉,而任务C和任务F不受监控。
  • 如果任务D和任务E本身不需要接收报警,请联系基线责任人,从基线上移除任务D和任务E。
  • 任务A和任务B是受保障的任务D和任务E的上游任务,虽然不在基线上,但会影响基线数据的产出。一旦任务A和任务B出错或变慢,便会产生事件报警,默认报警给任务责任人。

    如果任务A和任务B无需接收报警,请联系任务责任人删除任务D和任务E对它们的依赖。

在运维中心设置告警后,未收到告警的短信或邮件,该如何处理?

如果未正确设置报警接收人的手机或邮箱信息,系统会向基本接收管理中产品的欠费、停服、即将释放等信息的消息接收人发送告警信息,导致报警接收人未收到告警短信或邮件。

解决方法如下:
  1. 登录DataWorks控制台
  2. 在左侧导航栏,单击工作空间列表
  3. 单击相应工作空间后的进入数据开发
  4. 单击右上角的用户名,选择用户信息
  5. 个人信息页面,查看邮箱和手机号的信息是否正确,您可以根据提示补充或修改信息。
    注意 仅支持主账号修改子账号的邮箱、手机号等信息。
    个人信息

为什么开启的基线破线未报警?

基线开关开启的基线监控是针对任务的。如果所有的任务都正常,即使破线也不会报警,因为所有的任务都运行正常,无法判断出哪个任务出错。

任务都正常但基线仍破线的原因,通常有以下原因:
  • 设置的基线时间不合理。
  • 任务的依赖有问题,即使基线破线也不报警。

变慢的任务是否可以不报警?

任务变慢报警一定要满足以下两个条件:
  • 任务处于重要的基线上游。
  • 任务和往常比较,确实存在变慢的情况。
您可以在事件管理页面查看下游基线信息,并和下游监控任务的基线方确认任务变慢的影响程度。
  • 如果任务变慢的影响不大,可以选择忽略。
  • 如果确认要为下游方负责,请维护好任务。

为什么未收到出错任务的报警?

并不是所有任务出错后都会报警,任务需要满足下述条件之一,才会在出错后进行报警:
  • 处于某条基线开关开启的基线的上游。
  • 设置了相关的自定义提醒规则。

如何处理夜间收到报警的情况?

  1. 进入数据开发页面:
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据开发
  2. 单击左上角的图标图标,选择全部产品 > 任务运维 > 运维中心
  3. 在左侧导航栏,单击智能监控 > 事件管理
  4. 事件管理页面关闭报警。您可以通过以下两种方式关闭夜间的报警:
    • 处理报警事件,在处理期间会暂停事件报警:
      1. 单击相应事件后的处理
      2. 处理事件对话框中,设置预计处理时间
      3. 单击确定
        说明 事件的处理操作记录会被记录,并且在处理期间暂停报警。
    • 忽略报警事件,永久关闭事件报警:
      1. 单击相应事件后的忽略
      2. 忽略事件对话框中,单击确定
        说明 事件的忽略操作记录会被记录,忽略后会永久关闭事件报警。