全部产品
Search
文档中心

实时计算Flink版:查看运行异常日志

更新时间:Aug 01, 2023

在作业启动或者运行异常时,您可以查看运行异常日志。本文为您介绍如何查看Job Manager异常、失效Task Managers日志和慢Checkpoint对应的Task Managers日志。

背景信息

类型

详情

Job Manager异常

如果作业出现Failover,导致作业运行失败,则需要查看Job Manager异常。关于如何查看Job Manager异常的详情,请参见查看Job Manager异常

说明

如果Job Manager都没启动起来,不属于Job Manager异常,需要在启动日志中去查看。

失效Task Managers日志

运行状态为正常的作业,不会有失败TM。但是对于风险等级较高的,可能有失败的TM,但TM又被拉起了,这时可以查看失败的TM归档日志去定位可能的原因。关于如何查看失败的TM的日志详情,请参见查看失效Task Managers日志

说明

只有开启了日志归档才能查看失效Task Managers日志,并且只能查看日志归档中配置的保留天数之内的失效Task Managers日志。

慢Checkpoint对应的Task Managers日志

作业运行过程中,如果有的Checkpoint运行耗时较长,您需要去查看其具体的原因,则可以去查看其关联的TM的日志。关于如何查看慢Checkpoint关联的TM的日志详情,请参见定位慢Checkpoint并查看对应Task Managers的日志

前提条件

作业实例为运行状态。

注意事项

支持日志分页,每页显示1 MB,大概会显示8000~9000行日志,基本可以帮您排查错误。如果在第一页还未定位到问题,请注意切换页码查看日志。

查看Job Manager异常

  1. 登录实时计算控制台

  2. Flink全托管页签,单击目标工作空间操作列下的控制台

  3. 在左侧导航栏上,单击作业运维后,单击目标作业名称。

  4. 作业探查页签,选择左侧的异常信息页签后,查看Job Manager异常信息。

    405996-1.png
    说明

    异常历史中,您可以查看近7天内产生的异常信息,并过滤异常类型后查看历史异常。

查看失效Task Managers日志

  1. 登录实时计算控制台

  2. Flink全托管页签,单击目标工作空间操作列下的控制台

  3. 在左侧导航栏上,单击作业运维后,单击目标作业名称。

  4. 作业探查页签,选择运行日志后,选择正在运行的作业实例。

    405996-2.png
  5. 单击失效Task Managers页签。

定位慢Checkpoint并查看对应Task Managers的日志

  1. 登录实时计算控制台

  2. Flink全托管页签,单击目标工作空间操作列下的控制台

  3. 在左侧导航栏上,单击作业运维后,单击目标作业名称。

  4. 查看慢Checkpoint日志信息。

    1. 作业探查页签,单击Checkpoints页签,单击Checkpoints历史。

    2. 查看End to End Duration列值,确认慢Checkpoint对应的ID。

      Checkpoint ID
    3. 单击慢Checkpoint对应的ID左侧的加号,确认慢Checkpoint对应的Operators节点。

    4. 单击Operators节点左侧的加号,展开查看每个Task的情况。

    5. 单击慢Checkpoint对应的Task节点对应的ID

      Task节点
    6. 在跳转的页面运行Task Managers页签,查看慢Checkpoint日志信息。