全部产品
Search
文档中心

大数据开发治理平台 DataWorks:手动修正数据

更新时间:May 08, 2024

本文将为您介绍如何在手动修正数据页面,对规则识别不准确的数据进行手动修正。

说明

手动修正的数据结果,在第2天才会生效展示。

背景信息

DataWorks支持您对数据识别规则识别不准确的敏感数据进行手动修正,手动修正数据的使用逻辑如下图所示。手动修正数据

手动修正数据

  1. 进入数据识别规则。详情请参见:进入数据识别规则

  2. 单击手动修正数据页签,进入手动修正数据页面。

  3. 手动修正识别结果不准确的数据。手动修正

    操作

    描述

    筛选

    在上图的区域①,您可以通过筛选条件过滤需要查询的识别结果。

    你可以根据引擎类型项目空间名称表名字段名等条件进行筛选,还支持您单击高级筛选,展开更多筛选条件,您可以进一步通过分类分级敏感状态等条件进行筛选。

    • 分类:当前租户默认分类分级模板中的分类信息。详情请参见:配置敏感数据分类分级

    • 分级:当前租户默认分类分级模板中的分级信息。

    • 敏感状态:包括敏感字段和非敏感字段。非敏感字段为您过滤已手动修改为非敏感字段的数据。

    说明

    目前支持对ODPS、EMR、CDH、HOLO引擎中的敏感字段识别结果进行修正。

    修正单个数据

    在上图的区域②为您展示识别结果列表,您可以单击显示字段设置勾选您需要关注的字段信息,刷新识别结果列表详情。列表默认为您展示项目空间表名称字段名称敏感字段类型,同时,您还可以单击操作列的血缘关系进入查看敏感数据血缘(公测)模块查看字段级别的数据血缘关系。

    对于敏感字段类型识别结果有误的字段,单击右侧敏感字段类型列的下拉框,列表中为您展示当前租户下默认分类分级模板中已发布的敏感字段类型。您可以查看已有的敏感字段类型是否满足需求:

    • 满足需求:则选择其他已有敏感字段类型,并单击右侧的查看图标进入数据识别规则页面修改原敏感字段类型对应的识别规则和修改后的敏感字段类型对应的识别规则,以保证后续识别的准确性。

    • 不满足需求:您可以单击右侧的查看图标进入数据识别规则页面,或滑动至下拉框底部,单击管理敏感字段类型,默认跳转至数据识别规则页面并打开新建敏感字段类型弹窗,新增敏感字段类型,并配置识别规则。详情请参见:配置数据识别规则

    批量修正数据

    选中需要批量修正的字段,单击上图区域③的批量修正按钮,弹出批量修正识别结果对话框,敏感字段类型下拉框列表中为您展示当前租户下默认分类分级模板中已发布的敏感字段类型,你可以选择正确的敏感字段类型,单击保存,完成批量修正识别结果的操作。

管理识别结果

对于系统未识别到的数据,您可以单击右上角的新增识别结果手动添加识别结果,同时支持您单击导出识别结果导出筛选条件下的识别结果至本地。

  • 新增识别结果:在弹出的对话框中选择要新增的字段所在的引擎,并输入格式为project.table.column的字段GUID后,选择该字段对应的敏感字段类型(当前租户默认分类分级模板中已发布的敏感字段类型),单击确定,完成识别结果的导入。新增识别结果

  • 导出识别结果:单击导出识别结果自动为您导出当前筛选条件下的识别结果。

    说明

    最多支持导出10万条数据。