完成作业开发和部署后,您需要在作业运维页面启动作业至运行阶段。此外,作业在停止后需要恢复时,也需要启动作业。本文以SQL的流作业和批作业为例为您介绍如何启动作业。
前提条件
其他阿里云账号或RAM用户共同使用实时计算Flink版产品时,需要为阿里云账号或RAM用户授权,以进行作业启动等相关操作,详情请参见阿里云账号角色授权、RAM用户授权和作业操作账号授权。
使用限制
仅流作业支持填写启动选项。
仅实时计算引擎VVR4.0.11及以上版本支持State兼容性检测。
仅日志服务SLS和消息队列Kafka支持在界面上设置源表开始时间。
作业启动界面指定的读取数据时间优先级高于作业DDL代码里设置的startTime。即如果您在作业DDL和作业启动界面都指定了读取数据时间,则作业启动界面指定的读取数据时间生效。
说明不是所有的Connector都支持startTime,详情请参见各Connector WITH参数是否包含startTime,例如日志服务SLS WITH参数。
只有全新启动作业并指定了startTime,startTime才生效。如果基于Checkpoint或Savepoint启动作业,即使指定了startTime,startTime也不会生效。
注意事项
在启动作业时,如果您选择从最新状态或指定状态启动作业时,系统会进行State兼容性检测。兼容性检测详情请参见Flink State兼容性参考。
操作步骤
进入作业启动界面。
登录实时计算控制台。
在Flink全托管页签,单击对应工作空间操作列下的控制台。
在左侧导航栏上,选择 。
在作业模式下拉列表中,选择流作业或批作业。
在目标作业名称右侧,单击操作列中的启动。
填写启动选项信息。
流作业的启动选项详情如下:
无状态启动:当您是新上线作业,可以选择无状态启动。此外,如果无法复用State,也可以无状态启动。选择无状态启动后,您可以选中指定源表开始时间并指定具体的时间信息。
有状态启动:您可以根据业务情况选择具体的策略。
策略
说明
从最新状态恢复
从快照或者系统检查点的最新状态进行恢复。如果您选择从最新状态启动作业时,系统会进行State兼容性检测。兼容性检测详情请参见Flink State兼容性参考。
从指定状态恢复
选择指定的快照,快照创建步骤详情请参见作业状态集管理。
从其他作业恢复
您可以指定作业快照,进行作业恢复。支持作业间快照的共享,此时您需要满足作业间的状态的兼容性。详情请参见作业状态集管理。
允许忽略部分算子状态(AllowNonRestoredState)
默认情况下,Flink系统会尝试将整个快照与正在提交的作业匹配。作业的修改引起算子状态的变化,会出现任务不能恢复的情况。此时您可以打开此开关,Flink系统将跳过无法匹配的状态,让作业先正常启动起来。允许忽略部分算子状态详情请参见Allow None-Restored State。
单击启动。
在作业运维页面,查看作业运行状态,详情请参见查看作业运行状态。