数仓分层检查器用于规范目标分层中模型及指标的命名,制定模型及指标的命名规范,在模型和指标创建时,系统会根据该规范自动生成表名,模型发布成表后,使用方也能通过表名快速了解表的业务信息。本文为您介绍如何配置及使用数仓分层检查器。

前提条件

已创建数仓分层,创建数仓分层详情请参见创建数仓分层

配置数仓分层检查器

  1. 数仓分层页面,单击已创建的分层,进入数仓分层详情页。
  2. 配置数仓分层检查器。
    1. 检查器管理区域,新建检查器。
      您可选择创建模型检查器指标检查器,用于规范当前数仓分层中模型或指标的命名。
      说明 一个数仓分层允许添加多条模型或指标命名规则。
      创建规则检查器参数配置说明如下表。
      配置项描述
      规则名称新建检查器的规则名称。
      规则类型
      • 模型规则:默认为表名(表英文名),在创建模型时,可通过选择对应的检查器自动生成表名。
      • 指标规则:可配置为中文名称英文缩写,在创建指标时,自动生成派生指标名称。
      规则定义定义模型或指标的命名规范。后续使用该规范检测分层中模型或指标的名称。
      • 模型规则
        • 输入表的前缀信息,通过表前缀进行检测。例如,数仓分层要求表名称以dim开头,则可输入dim
        • 也可单击图标图标,使用业务大类英文缩写、数据集市英文缩写、主题域英文缩写等多种类别的来定义规则。可自由组合。
          说明 不同模型(例如,应用表、维度表)定义规则时可选类别存在差异,具体请以实际界面为准。
      • 指标规则:选择修饰词、原子指标、统计周期来定义规则。可自由组合。
      描述检查器的描述说明。
    2. 设置默认检查器。
      您可为模型或指标设置默认检查器,后续创建模型或指标时,默认使用该检查器为模型或指标自动生成表名。下图以模型检查器为例,为您展示配置界面。设置默认检查器
    3. 设置检查器规则的强弱。
      您可为创建的检查器设置规则的强弱程度。下图以模型检查器为例,为您展示配置界面。设置规则强弱
      所有模型或指标检查器统一使用一种强弱程度的规则,即统一为强规则,或统一为弱规则。后续在维度建模新建对象(模型或指标)时,不同规则的操作限制如下:
      • 弱规则:命名检查器被设置为弱规则时,用户在创建模型或指标时,可选择使用该规范创建模型或指标名称,也可不遵守该规范创建模型或指标名称。弱规则逻辑
      • 强规则:命名检查器被设置为强规则时,用户在创建模型或指标时,必须要使用该规范创建模型或指标名称,否则无法保存模型或指标。强规则
  3. 触发检测并查看检测结果。
    1. 检查器配置完成后,单击触发检测,根据检查器的配置内容,检测分层中所有模型的命名是否符合当前分层中指定的规范,系统会将不符合规范的模型展示出来。您可根据检测结果进行相关处理操作。
      说明
      • 检测操作仅触发启用状态的检查器。
      • 新建的检查器默认为启用状态。若您无需使用检查器,则可将其关闭,关闭后将不会触发该检查器执行检测任务。
    2. 检查结束后,单击查看结果,即可查看本次检测结果。

数仓分层检查器使用示例

  • 示例一
    某公司希望目标数仓分层中的表以dim_开头。当数仓分层中包含命名为dim_skudim_storedimension_warehousefact_order的表时,触发检测后,检测结果如下表所示。
    表名称是否符合数仓分层的命名规范
    dim_sku匹配
    dim_store匹配
    ension_warehouse不匹配。名称不符合以dim_开头的规范。
    fact_order不匹配。名称不符合以dim_开头的规范。
  • 示例二

    某公司希望DWD数仓分层中的表使用dwd_数据域_自定义表命名标签缩写_存储策略格式命名。其中,表需以dwd开头,数据域为sale,自定义表命名标签缩写为order,存储策略为df/di

    当该数仓分层中包含命名为dwd_sale_order_dfdwd_sale_order_didwd_sale_orderdws_sale_order_df的表时,触发检测后,检测结果如下表所示。
    表名称是否符合数仓分层的命名规范
    dwd_sale_order_df匹配
    dwd_sale_order_di匹配
    dwd_sale_order不匹配。表名称缺少存储策略df/di
    dws_sale_order_df不匹配。表的开头dws不符合命名规范。
  • 示例三
    某公司的模型委员会希望在创建派生指标时统一并规范指标的名称,因此在DWS数仓分层中设置了按照时间周期_修饰词_原子指标顺序来组织指标中文名称的强规则。当开发者在该数仓分层中新建中文名称为近1天_A门店_用户数量近30天_北京市_B商品_销售金额A门店_用户数量_近7天A门店_用户数量的派生指标时,保存指标将触发命名规则的检测,检测结果如下表所示。
    指标名称是否符合数仓分层的命名规范
    近1天_A门店_用户数量匹配
    近30天_北京市_B商品_销售金额匹配
    A门店_用户数量_近7天不匹配
    A门店_用户数量不匹配

后续步骤

数仓分层检查器配置完成后,您可继续进行数仓规划中的数据域、业务过程与业务分类的规划和创建。详情请参见数据域业务过程业务分类