字段标准是对含义相同但字段名称不同的数据进行统一规范管理的数据准则,字段标准可定义字段的取值范围、度量单位等内容。当字段标准发生变化时可快速定位或变更对应的表,极大地提升了应用效率和准确率。本文将为您介绍字段标准的创建方法。

背景信息

字段标准又称为数据字典,可理解为全局字段管理。可将多个表中含义相同但字段名不同的内容进行关联,并对该字段制定相关的取值范围、度量单位、标准代码等内容。后期字段标准发生变化时,可快速定位和变更关联的表,极大程度提升构建效率、应用效率、准确性和后期治理效果。

相关示例如下:

现有注册表和登录表,注册表中存储了会员ID,字段名为user_id,登录表中也存储了会员ID,字段名为userid。此时两个表中包含的会员ID均是同一内容,但是使用了两种不同的字段名进行描述,字段出现了歧义便需要人工介入理解进行确认。

解决方法如下:

我们可通过DataWorks数据建模创建新的字段标准,预先在模型中定义会员ID标准,然后在创建注册表和登录表时,将对应会员ID的字段引用该标准。在后期分析中可自动推荐两张表的关联关系和关联字段,极大地提升应用效率和准确性。

新建标准

注意层级关系

  • 字段标准在创建时需要放在根目录、目录或标准集下方,相关说明如下。
    • 根目录:目录中最顶级的目录,所有的目录、标准集、标准只能放置在根目录下。
    • 目录:用于存放标准和标准集,类似操作系统的文件夹目录。
    • 标准集:和目录类似,但标准集内只能存放标准。
  • 字段标准之间可存在继承关系,如买家ID标准和卖家ID标准均可继承于会员ID标准。

创建目录与标准集

  1. 进入数据标准
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的数据开发
    4. 单击左上方的图标图标,选择全部产品 > 数据建模 > 数据标准,进入数据标准页面。
  2. 在数据标准页面左侧导航栏,单击字段标准,进入字段标准页面。
  3. 新建根目录。
    1. 字段标准页面,单击加号图标,选择新建根目录
    2. 在弹出的新建根目录对话框中,填写名称,单击确认新建根目录
      名称只能由小写英文字母、数字、下划线(_)组成,并且以小写英文字母开头。最大长度不可超过128个字符。
    根目录创建成功后,可在左侧字段标准区域下方的目录树中查看已创建的根目录。
  4. 可选:新建子目录。
    1. 在左侧目录树,选择已创建完成的根目录。
    2. 右击根目录名称,选择新建子目录
    3. 在弹出的新建子目录对话框中,填写名称,单击确认新建子目录
      名称只能由小写英文字母、数字、下划线(_)组成,并且以小写英文字母开头。最大长度不可超过128个字符。
  5. 可选:新建标准集。
    1. 在左侧目录树,选择已创建完成的根目录或子目录。
    2. 右击目录名称,选择新建标准集
    3. 在弹出的新建标准集对话框中,填写名称,单击确认标准集
      名称只能由小写英文字母、数字、下划线(_)组成,并且以小写英文字母开头。最大长度不可超过128个字符。

创建标准

  1. 在左侧目录树下,选择对应目录或标准集。
  2. 右击目录或标准集名称,选择新建标准
  3. 在弹出的新建标准对话框中,配置如下内容。
    新建标准
    参数项 参数描述
    标准编号 自定义编码。

    标准编码由英文字母、数字、下划线(_)组成,并且以英文字母开头。最大长度为64个字符。

    英文缩写 字段标准的英文缩写。

    英文缩写由小写英文字母、数字、下划线(_)组成,并且以小写英文字母开头。最大长度不可超过128个字符。

    英文名称 字段标准的英文名称。

    英文名称由英文字母、数字、下划线(_)、and(&)组成,并且以英文字母或数字开头。名称最大长度不可超过2048个字符。

    中文名称 字段标准的中文名称。

    中文名称由中文、英文字母、数字、下划线(_)、and(&)、英文括号组成,并且以中文、英文字母或数字开头。名称最大长度不可超过2048个字符。

    数据类型 对应字段的数据类型,包括如下:

    BIGINT、DOUBLE、DECIMAL、STRING、DATETIME、BOOLEAN。

    长度 数据类型关联参数。

    例如,选择DECIMAL类型,则长度对应DECIMAL(20,4)中的20。

    精度 数据类型关联参数。

    例如,选择DECIMAL类型,则长度对应DECIMAL(20,4)中的4。

    非空 引用该标准的字段值是否可以为空。默认为空。
    默认 引用该标准的字段值未填写时的默认值。最大长度不可超过2048个字符。
    业务定义 对业务的定义描述,最大长度不可超过2048个字符。
    所属路径 标准所属的目录,您可从已创建的目录、子目录、标准集中选择。
    父级标准 可选择已创建的标准作为父级标准,选择后与该标准产生继承关系,帮助您更好地识别字段的关联关系。

    例如,买家ID和卖家ID均属于会员ID,则买家ID标准和卖家ID标准的父级标准就是会员ID标准。

    引用代码 您可从已创建的标准代码中,引用指定标准代码来约束字段的取值范围,标准代码请参见标准代码

删除

  • 删除标准
    说明 字段标准如已被引用,则无法删除,需在对应部分删除引用。
    1. 单击标准所在的标准集或目录名称。
    2. 在标准列表单击对应标准操作列的删除
  • 删除标准集、子目录、根目录

    在左侧目录树直接右击标准集、子目录或根目录的名称,选择删除

    说明 不支持跨层级删除目录。

后续步骤

创建完成后,您可在数据建模配置事实表与维度表字段时进行关联,关联方法请参见字段管理:添加表字段