补数据可通过补历史或未来一段时间的数据,写入数据至对应时间分区。代码中若使用调度参数,则该参数将根据补数据选择的业务时间自动替换为具体值,结合业务代码将对应时间数据写入对应分区。具体写入的分区与执行的代码逻辑,与任务定义的代码有关。本文为您介绍如何补数据并管理补数据实例。
背景信息
补数据模式 | 描述 |
---|---|
当前节点 | 用于对当前节点进行补数据操作。 |
当前节点及下游节点 | 用于对当前节点及下游节点进行批量补数据操作,通常在当前节点的下游节点数量较少时使用该功能,支持指定部分下游节点。 |
海量节点模式 | 用于对当前节点及下游节点进行批量补数据操作,通常在当前节点的下游节点数量较多时使用该功能,支持按照项目筛选下游节点。同时,支持设置节点白名单和黑名单,选中或过滤目标节点。 |
高级模式 | 用于灵活选择一批节点进行批量补数据操作,节点之间可以不存在依赖关系。您可在DAG图上使用可视化方式添加节点,也可在任务列表中添加节点。
|
使用限制
- 仅华南1(深圳)、中东东部 1(迪拜)地域支持周期任务使用高级模式进行补数据。
- 不支持手动删除补数据实例,实例在过期后(30天左右)平台将自动删除。如果任务不需要再运行,可以选择冻结实例。
- 公共调度资源组实例保留一个月(30天)、日志保留一周(7天)。
- 独享调度资源组任务实例、日志保留一个月(30天)。
- 完成状态的实例日志大于3M时,每天会定时进行清理。
注意事项
- 当补一个区间的数据时,在启动补数据的第一天存在一个运行失败的实例,则当天的补数据实例会被置为失败状态,第二天的实例也不会启动运行(只有当天的全部任务实例都成功,第二天的任务实例才会开始运行)。
- 小时或分钟任务补某一天数据时,当天所有实例是否并发执行与任务是否设置自依赖有关。
- 如果周期实例和补数据实例均启动运行,为了保证周期实例的正常运行,您需要终止补数据实例的运行。
- 补数据实例过多或并行数过高可能导致周期调度的资源紧张,请您根据需求合理配置。
- 为避免补数据实例占用过多的资源而影响周期实例的运行,平台对补数据实例制定以下规则:
- 如果补数据选择业务日期为昨天(T-1),即补当天数据时,补数据任务优先级由任务所在基线优先级决定。
- 如果补数据选择业务日期为历史业务日期(T-2)时,补数据任务将按照以下规则对任务进行降级处理:
- 7级、8级任务优先级降成3级。
- 5级、3级任务优先级降为2级。
- 1级任务优先级保持不变。
进入补数据界面
- 进入运维中心。
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 选择工作空间所在地域后,单击相应工作空间后的
图标,选择运维中心。
- 在左侧导航栏,单击周期任务页面。 ,进入
- 目标节点补数据。
执行补数据
选择补数据模式后,配置相关参数,单击确定,启动补数据。
当前节点补数据

参数 | 描述 |
---|---|
补数据名称 | 系统会自动生成补数据名称,您可根据需要进行修改。 |
当前任务 | 当前选中的任务。 |
业务日期 | 选择执行补数据任务的业务日期,业务日期精确到天。
说明 建议补数据的时间不要太长,以免出现任务需要等待资源的情况。 |
并行 | 您可通过选择是否并行,控制同时生成多少个补数据实例来进行补数据,具体如下:
|
并行数 | 用于配置当前补数据任务生成的补数据实例个数,当进行补数据时,所有补数据实例并行执行。 说明 当并行参数选择是时,需配置并行数。 并行数取值最小为2组,最大为10组。多个实例并行执行的情况如下:
|
补数据告警 | 可设置此次补数据操作是否会触发告警。
|
触发条件 | 您可选择如下条件触发告警:
说明 仅当补数据告警选择是时,需配置该参数。 |
告警方式 | 您可选择通过短信与邮件、短信、邮件等方式接收告警,告警接收人为补数据的发起人。 说明
|
顺序 | 您可选择按照业务日期正序或业务日期倒序进行补数据。 |
调度资源组 | 您可通过该配置实现本次补数据实例在指定调度资源组上执行,避免补数据实例与周期实例抢占资源。
|
运行时间段 | 选择执行补数据任务的运行时间段。
|
当前节点及下游节点补数据

参数 | 描述 |
---|---|
补数据名称 | 系统会自动生成补数据名称,您可根据需要进行修改。 |
业务日期 | 选择执行补数据任务的业务日期,业务日期精确到天。
说明 建议补数据的时间不要太长,以免出现任务需要等待资源的情况。 |
并行 | 您可通过选择是否并行,控制同时生成多少个补数据实例来进行补数据,具体如下:
|
并行数 | 用于配置当前补数据任务生成的补数据实例个数,当进行补数据时,所有补数据实例并行执行。 说明 当并行参数选择是时,需配置并行数。 并行数取值最小为2组,最大为10组。多个实例并行执行的情况如下:
|
补数据告警 | 可设置此次补数据操作是否会触发告警。
|
触发条件 | 您可选择如下条件触发告警:
说明 仅当补数据告警选择是时,需配置该参数。 |
告警方式 | 您可选择通过短信与邮件、短信、邮件等方式接收告警,告警接收人为补数据的发起人。 说明
|
顺序 | 您可选择按照业务日期正序或业务日期倒序进行补数据。 |
调度资源组 | 您可通过该配置实现本次补数据实例在指定调度资源组上执行,避免补数据实例与周期实例抢占资源。
|
运行时间段 | 选择执行补数据任务的运行时间段。
|
选择需要补数据的节点 | 您可根据任务名称、层级等条件进行筛选过滤,选择需要补数据的目标节点。 说明
|
海量节点模式补数据

参数 | 描述 |
---|---|
补数据名称 | 系统会自动生成补数据名称,您可根据需要进行修改。 |
业务日期 | 选择执行补数据任务的业务日期,业务日期精确到天。
说明 建议补数据的时间不要太长,以免出现任务需要等待资源的情况。 |
补数据告警 | 可设置此次补数据操作是否会触发告警。
|
触发条件 | 您可选择如下条件触发告警:
说明 仅当补数据告警选择是时,需配置该参数。 |
告警方式 | 您可选择通过短信与邮件、短信、邮件等方式接收告警,告警接收人为补数据的发起人。 说明
|
顺序 | 您可选择按照业务日期正序或业务日期倒序进行补数据。 |
调度资源组 | 您可通过该配置实现本次补数据实例在指定调度资源组上执行,避免补数据实例与周期实例抢占资源。
|
运行时间段 | 选择执行补数据任务的运行时间段。
|
按工作空间选择需要补数据的节点 | 您可根据业务需求,在您的所有项目区域,选择目标工作空间,将其添加至补数据的项目区域,为目标工作空间中所选节点进行补数据。 说明
|
节点白名单 | 除选中的DataWorks工作空间中包含的节点外,仍需要进行补数据的节点。 说明 目前仅支持通过节点ID搜索目标节点。 |
节点黑名单 | 选中的DataWorks工作空间中不需要进行补数据的节点。 说明 目前仅支持通过节点ID搜索目标节点。 |
高级模式补数据

- 选择需要补数据的节点。
- 在当前周期任务的DAG图中,您可以结合DAG图的聚合功能(区域1),按照不聚合、按所属工作空间聚合、按责任人聚合或按优先级聚合等维度将节点划分为组,直接勾选该节点组(区域2),快速添加目标类别的节点为补数据节点。DAG图的聚合功能,详情请参见附录:DAG图功能介绍。
- 您也可在周期任务界面,通过节点名称、节点类型、责任人、调度资源组等筛选条件进行过滤(区域3),在左侧任务列表中,勾选符合条件的周期任务为需要补数据的节点(区域4),单击下方的添加,将目标周期任务添加至补数据任务中。说明 该方式是将整个目标周期任务添加至补数据任务中,因此系统会对该周期任务中的所有节点进行补数据。如果您希望对周期任务中的部分节点进行补数据,则可以单击目标周期任务的名称,进入DAG图界面,选择需要进行补数据的节点。
- 查看补数据节点。补数据节点添加完成后,您可在区域5的补数据面板,查看已选择的节点。同时,您还可执行如下管理操作:
- 单击目标节点后的
图标,跳转至该节点的DAG图界面,可重新勾选该DAG图中需要补数据的节点。
- 单击目标节点后的
图标,在当前补数据任务中删除该节点。
- 单击目标节点后的
- 在区域5的补数据面板,单击去配置,配置补数据任务的相关参数。
参数说明如下。
参数 描述 补数据名称 系统会自动生成补数据名称,您可根据需要进行修改。
已选任务数 当前补数据任务中包含的节点个数。您可单击修改,修改当前补数据任务包含的节点。 业务日期 选择执行补数据任务的业务日期,业务日期精确到天。- 如果您需要对该任务的多个不连续的时间段进行补数据,则可单击添加多段业务日期,配置多个时间段。
- 当配置的业务日期晚于当前日期,则您可选择立即运行定时时间大于此刻的补数据实例,后续当实际时间大于配置的业务日期时间,系统会立即运行该补数据实例。
例如,当前日期为
2021-08-24
,业务日期为2021-09-17
,则等实际日期为2021-09-18
(立即大于业务日期)时,该补数据实例会立即启动运行。
说明 建议补数据的时间不要太长,以免出现任务需要等待资源的情况。并行 您可通过选择是否并行,控制同时生成多少个补数据实例来进行补数据,具体如下:- 否:按照业务日期顺序串行执行,前一个补数据实例运行结束后下个补数据实例才会运行。
- 是:根据配置的并行数,按照业务日期将补数据实例拆分成若干组并行执行。同一时刻有多个不同业务日期的补数据实例运行。说明 小时、分钟任务某天实例是否并发执行,与小时、分钟任务本身是否设置自依赖有关。
并行数 用于配置当前补数据任务生成的补数据实例个数,当进行补数据时,所有补数据实例并行执行。说明 当并行参数选择是时,需配置并行数。并行数取值最小为2组,最大为10组。多个实例并行执行的情况如下:- 如果业务日期的跨度时间少于配置的并行组数,则并行执行。例如业务日期是1月11日~1月13日,并行数配置为4组,则只会生成三个补数据实例(每个补数据实例对应一个业务日期),三个实例同时并发执行。
- 如果业务日期的跨度大于选择的并行组数,则系统会结合配置的业务日期顺序兼有串行和并行。例如业务日期是1月11日~1月13日,并行数配置为2组,则会生成两个补数据实例(其中一个补数据实例会有两个业务日期,这两个业务日期对应的任务串行执行),两个补数据实例并行执行。
补数据告警 可设置此次补数据操作是否会触发告警。- 是:满足触发条件,则产生告警。
- 否:此次补数据不会触发告警。
触发条件 您可选择如下条件触发告警:- 失败或成功皆告警:无论补数据运行成功或失败,均会产生告警。
- 成功告警:仅当补数据成功,才产生告警。
- 失败告警:仅当补数据失败,才产生告警。
说明 仅当补数据告警选择是时,需配置该参数。告警方式 您可选择通过短信与邮件、短信、邮件等方式接收告警,告警接收人为补数据的发起人。说明- 仅当补数据告警选择是时,需配置该参数。
- 单击检验联系方式,即可验证报警接收人的手机号或邮箱是否已登记,若未登记,则可参考查看和设置报警联系人配置。
顺序 您可选择按照业务日期正序或业务日期倒序进行补数据。
调度资源组 您可通过该配置实现本次补数据实例在指定调度资源组上执行,避免补数据实例与周期实例抢占资源。- 是:可选择使用指定补数据的资源组。
- 否:将使用原本配置的资源组执行。
运行时间段 选择执行补数据任务的运行时间段。- 是:可指定开始执行补数据实例的时间。
- 否:正常为立即运行,若运行业务日期为今天或未来时间,且未勾选立即运行的情况下,将按照实例定时时间执行。
管理补数据实例

区域 | 描述 |
---|---|
1 | 在该区域,您可以通过筛选条件过滤出需要查询的实例,也可快速批量终止正在运行的补数据任务。 您可以根据节点名称、节点ID、补数据名称、创建人、创建日期、运行状态、业务日期、我的节点、我发起的等条件进行精确筛选。 说明
|
2 | 在该区域,您可以查看补数据实例的相关信息,包括:
在该区域,您还可以对补数据实例执行如下操作:
|
3 | 在该区域,您可以查看补数据实例所包含节点的相关信息,包括:
在该区域,您还可以对节点任务执行如下操作:
|
4 | 您可以在区域3勾选多个目标节点任务,在本区域(区域4)单击终止运行或重跑,即可批量终止运行或重新运行所选的节点任务。 |
实例状态说明
序号 | 状态类型 | 状态标识 |
---|---|---|
1 | 运行成功状态 | ![]() |
2 | 未运行状态 | ![]() |
3 | 运行失败状态 | ![]() |
4 | 正在运行状态 | ![]() |
5 | 等待状态 | ![]() |
6 | 冻结状态 | ![]() |