数仓分层检查器用于规范目标分层中模型及指标的命名,统一同一分层中模型及指标的命名格式,便于您通过名称即可了解到该模型及指标所属的业务类型、数据粒度等信息。同时,帮助您减少后期的运维成本。本文为您介绍如何配置及使用数仓分层检查器。

前提条件

已创建数仓分层,创建数仓分层详情请参见创建数仓分层

配置数仓分层检查器

  1. 数仓分层页面,单击已创建的分层,进入数仓分层详情页。
  2. 配置数仓分层检查器。
    1. 检查器管理区域,新建检查器。
      您可选择创建模型检查器指标检查器,用于规范当前数仓分层中的模型及指标的命名。
      说明 一个数仓分层允许添加多条指标命名规则。当已创建多个规则时,DataWorks支持为模型或指标选择默认的规则检查器。
      创建规则检查器参数配置说明如下表。
      配置项 描述
      规则名称 新建检查器规则的名称。
      规则类型
      • 模型规则:默认为表名,即用于规范模型表的名称。
      • 指标规则:可配置为中文名称英文名称,即用于规范指标的中英文命名。
      规则强弱 指定所建规则的强弱程度。新建对象(模型或指标)时,不同规则操作如下:
      • 弱规则:仅根据规则定义推荐对象名称。
      • 强规则:根据规则定义推荐对象名称并强制校验所配置的名称。若名称不符合规则定义,则创建对象会失败。
      规则定义 定义模型或指标的命名规范。后续使用该规范检测分层中模型或指标的名称。
      • 模型规则
        • 输入表的前缀信息,通过表前缀进行检测。例如,数仓分层要求表名称以dim开头,则可输入dim
        • 也可单击图标图标,使用业务大类英文缩写、数据集市英文缩写、主题域英文缩写等多种类别的来定义规则。可自由组合。
          说明 不同模型(例如,应用表、维度表)定义规则时可选类别存在差异,具体请以实际界面为准。
      • 指标规则:选择修饰词、原子指标、统计周期来定义规则。可自由组合。
      描述 检查器的描述说明。
    2. 单击新增,检查器创建完成。
  3. 触发检测并查看检测结果。
    1. 检查器配置完成后,单击触发检测,根据检查器的配置内容检测分层中所有对象的命名规范。
      说明
      • 检测操作仅触发启用状态的检查器。
      • 新建的检查器默认为启用状态。若您无需使用检查器,则可将其关闭,关闭后将不会触发该检查器执行检测任务。
    2. 检查结束后,单击查看结果,即可查看本次检测结果。

数仓分层检查器使用示例

  • 示例一
    某公司希望目标数仓分层中的表以dim_开头,则检测器中配置的规则定义^dim_.*。当数仓分层中包含命名为dim_skudim_storedimension_warehousefact_order的表时,触发检测后,检测结果如下表所示。
    表名称 是否符合数仓分层的命名规范
    dim_sku 匹配
    dim_store 匹配
    dimension_warehouse 不匹配
    fact_order 不匹配
  • 示例二
    某公司希望DWD数仓分层中的表使用数仓分层的英文缩写_表所在的数据域_自定义表命名标签缩写_df/di格式命名。当该数仓分层中包含命名为dwd_sale_order_dfdwd_sale_order_didwd_sale_orderdws_sale_order_df的表时,触发检测后,检测结果如下表所示。
    表名称 是否符合数仓分层的命名规范
    dwd_sale_order_df 匹配
    dwd_sale_order_di 匹配
    dwd_sale_order 不匹配
    dws_sale_order_df 不匹配
  • 示例三
    某公司的模型委员会希望在创建派生指标时统一并规范指标的名称,因此在DWS数仓分层中设置了按照时间周期_修饰词_原子指标顺序来组织指标中文名称的强规则。当开发者在该数仓分层中新建中文名称为近1天_A门店_用户数量近30天_北京市_B商品_销售金额A门店_用户数量_近7天A门店_用户数量的派生指标时,保存指标将触发命名规则的检测,检测结果如下表所示。
    指标名称 是否符合数仓分层的命名规范
    近1天_A门店_用户数量 匹配
    近30天_北京市_B商品_销售金额 匹配
    A门店_用户数量_近7天 不匹配
    A门店_用户数量 不匹配

后续步骤

数仓分层检查器配置完成后,您可继续进行数仓规划中的数据域、业务过程与业务分类的规划和创建。详情请参见数据域业务过程业务分类