DataWorks的数据血缘功能支持可视化展示敏感数据的血缘关系,自动分析字段之间的异常关联关系、敏感数据识别结果异常的字段,帮助您梳理敏感数据的扩散情况及影响面,提高数据识别效率。本文为您介绍如何查看血缘关系图。

背景信息

数据血缘为您提供如下功能:
  • 可视化血缘图谱

    数据保护伞基于敏感字段之间的血缘关系,绘制成敏感数据血缘可视化图谱,帮助您清晰的了解数据的来龙去脉。

  • 提升数据识别效率

    敏感数据自动识别任务可基于敏感字段血缘关系,将其中敏感字段类型相同的血缘关系进行识别结果扩散,极大提高识别效率。

  • 异常血缘关系分析
    • 关联关系异常的字段分析

      系统根据敏感字段的血缘关系,自动分析字段之间的异常关联关系(例如,SELECT_CONCAT、SELECT_SUBSTRING等关系),避免相关人员通过字符拼接、拆解的方式绕过敏感数据的识别和使用审计。

    • 关联但识别结果不一致的字段分析

      帮助您识别出与查询字段有血缘关系,但敏感字段类型识别结果不一致的字段。例如,查询A字段,敏感数据类型为姓名,与其有血缘关系的字段有B(姓名)、C(省份),则识别结果不一致的字段是C。

使用限制

仅DataWorks企业版及以上版本用户才可以使用数据血缘功能。版本升级详情请参见DataWorks版本服务计费说明

进入数据血缘

  1. 进入数据保护伞。
    1. 登录DataWorks控制台后,进入数据保护伞页面,操作详情请参见数据保护伞概述
    2. 单击开始体验,默认进入数据保护伞的首页
  2. 进入数据血缘。
    您可以通过以下两种方式进入数据血缘页面。
    • 进入手动修正数据页面,找到需要查看血缘关系的字段,单击操作列的血缘分析跳转至数据血缘页面。
    • 进入数据保护伞后,在左侧导航栏单击数据血缘。进入数据血缘页面。

查看血缘关系图

数据血缘页面为您可视化展示敏感数据的血缘关系。数据血缘
类别描述
分析场景当前默认分析场景为单个字段的血缘关系,后续会陆续上线其他场景,敬请期待。
筛选在上图的模块②区域,支持您输入要查询的字段所属项目所属表字段名,单击查询,页面将为您展示对应字段的一层血缘关系,查询的字段会高亮显示。
过滤条件在上图模块③区域,您可以根据需求选择过滤条件:
  • 关联但识别结果不一致的字段
    勾选后,将会自动刷新血缘关系图,为您展示与查询字段有血缘关系,但敏感字段类型识别结果不一致的字段,并展示字段之间的边关系。
    说明 边关系为您创建字段时使用的SQL函数名称,例如,SELECT、SELECT_LTRIM等。
  • 关联关系异常字段

    勾选后,将会自动刷新血缘关系图,为您展示关联关系异常(例如,SELECT_CONCAT、SELECT_SUBSTRING等关系)的字段,并展示字段之间的边关系。

  • 同时勾选关联但识别结果不一致的字段关联关系异常字段时,将为您展示与选中的查询字段,关联关系异常且敏感字段类型识别结果不一致的字段,并展示字段之间的边关系。
血缘关系图在上图模块④区域,为您展示对应查询字段的一层血缘关系图,您可以单击对应字段或字段中间的边关系按钮,查看字段信息和边信息。
  • 查看字段信息
    单击字段,将为您打开字段详情页面,字段详情页面展示当前字段的数据位置信息、敏感字段类型,以及上、下游关联字段列表、字段之间的关联关系(例如,SELECT、SELECT_CONCAT、SELECT_REPEAT等关系)等。对于识别结果不准确的数据,您可以通过下图区域①修改当前字段的敏感字段类型;通过下图区域②修改上、下游关联字段的敏感字段类型分类分级等信息。
    说明
    • 当查询的字段没有上、下游关联字段时,列表将显示暂无数据。
    • 当敏感字段类型为非敏感字段或未识别时,敏感字段类型、分类、分级等信息将展示为空。
    • 修改敏感字段类型后,会同步更新敏感数据概况手动修正数据页面的数据。
    • 每个字段最多显示一层上、下游关联字段信息。
    字段信息
  • 查看边信息
    单击两个字段中间的边关系按钮,将在右侧弹窗展示边关系详情。包括:边关系边关系类型SQL详情上游节点列表下游节点列表。对于识别结果不准确的数据,您可以单击边关系类型右侧的下拉框修改字段间关联关系;单击上下游节点敏感字段类型下拉框修改敏感字段类型。
    说明
    • 当边关系异常时,在边关系右侧将展示异常关联标签,若无异常右侧将不展示任何标签。
    • 异常关联关系包括SELECT_CONCAT、SELECT_SUBSTRING等关系,即相关人员通过字符拼接、拆解的方式绕过敏感数据识别的情况。
    • 边关系类型为您创建字段时使用的SQL函数名称,例如,SELECT、SELECT_LTRIM等。
    • 当敏感字段类型为非敏感字段或未识别时,敏感字段类型将展示为空。
    边关系

批量修正数据

您可以通过以下两种方式,对敏感数据识别结果不准确的字段进行批量修正。

  • 通过血缘关系图查看当前字段的上、下游关联字段详情,批量选中字段进行修正。批量修正
  • 进入手动修正数据页面,批量选中字段进行修正。详情请参见:手动修正数据