全部产品
Search
文档中心

大数据开发治理平台 DataWorks:配置及使用数仓分层检查器

更新时间:Mar 25, 2024

数仓分层检查器用于规范目标分层中模型及指标的命名,制定模型及指标的命名规范,在模型和指标创建时,系统会根据该规范自动生成表名,模型发布成表后,使用方也能通过表名快速了解表的业务信息。本文为您介绍如何配置及使用数仓分层检查器。

前提条件

已创建数仓分层,创建数仓分层详情请参见创建数仓分层

配置数仓分层检查器

  1. 数仓分层页面,单击已创建的分层,进入数仓分层详情页。

  2. 配置数仓分层检查器。

    1. 检查器管理区域,新建检查器。

      您可选择创建模型检查器指标检查器,用于规范当前数仓分层中模型或指标的命名。

      说明

      一个数仓分层允许添加多条模型或指标命名规则。

      创建规则检查器参数配置说明如下表。

      配置项

      描述

      规则名称

      新建检查器的规则名称。

      规则类型

      • 模型规则:默认为表名(表英文名),在创建模型时,可通过选择对应的检查器自动生成表名。

      • 指标规则:可配置为中文名称英文缩写,在创建指标时,自动生成派生指标名称。

      规则定义

      定义模型或指标的命名规范。后续使用该规范检测分层中模型或指标的名称。

      • 模型规则

        • 输入表的前缀信息,通过表前缀进行检测。例如,数仓分层要求表名称以dim开头,则可输入dim

        • 也可单击图标图标,使用业务大类英文缩写、数据集市英文缩写、主题域英文缩写等多种类别的来定义规则。可自由组合。

          说明

          不同模型(例如,应用表、维度表)定义规则时可选类别存在差异,具体请以实际界面为准。

      • 指标规则:选择修饰词、原子指标、统计周期来定义规则。可自由组合。

      描述

      检查器的描述说明。

    2. 设置默认检查器。

      您可为模型或指标设置默认检查器,后续创建模型或指标时,默认使用该检查器为模型或指标自动生成表名。下图以模型检查器为例,为您展示配置界面。设置默认检查器

    3. 设置检查器规则的强弱。

      您可为创建的检查器设置规则的强弱程度。下图以模型检查器为例,为您展示配置界面。设置规则强弱

      所有模型或指标检查器统一使用一种强弱程度的规则,即统一为强规则,或统一为弱规则。后续在维度建模新建对象(模型或指标)时,不同规则的操作限制如下:

      • 弱规则:命名检查器被设置为弱规则时,用户在创建模型或指标时,可选择使用该规范创建模型或指标名称,也可不遵守该规范创建模型或指标名称。弱规则逻辑

      • 强规则:命名检查器被设置为强规则时,用户在创建模型或指标时,必须要使用该规范创建模型或指标名称,否则无法保存模型或指标。强规则

  3. 触发检测并查看检测结果。

    1. 检查器配置完成后,单击触发检测,根据检查器的配置内容,检测分层中所有模型的命名是否符合当前分层中指定的规范,系统会将不符合规范的模型展示出来。您可根据检测结果进行相关处理操作。

      说明
      • 检测操作仅触发启用状态的检查器。

      • 新建的检查器默认为启用状态。若您无需使用检查器,则可将其关闭,关闭后将不会触发该检查器执行检测任务。

    2. 检查结束后,单击查看结果,即可查看本次检测结果。

数仓分层检查器使用示例

  • 示例一

    某公司希望目标数仓分层中的表以dim_开头。当数仓分层中包含命名为dim_skudim_storedimension_warehousefact_order的表时,触发检测后,检测结果如下表所示。

    表名称

    是否符合数仓分层的命名规范

    dim_sku

    匹配

    dim_store

    匹配

    ension_warehouse

    不匹配。名称不符合以dim_开头的规范。

    fact_order

    不匹配。名称不符合以dim_开头的规范。

  • 示例二

    某公司希望DWD数仓分层中的表使用dwd_数据域_自定义表命名标签缩写_存储策略格式命名。其中,表需以dwd开头,数据域为sale,自定义表命名标签缩写为order,存储策略为df/di

    当该数仓分层中包含命名为dwd_sale_order_dfdwd_sale_order_didwd_sale_orderdws_sale_order_df的表时,触发检测后,检测结果如下表所示。

    表名称

    是否符合数仓分层的命名规范

    dwd_sale_order_df

    匹配

    dwd_sale_order_di

    匹配

    dwd_sale_order

    不匹配。表名称缺少存储策略df/di

    dws_sale_order_df

    不匹配。表的开头dws不符合命名规范。

  • 示例三

    某公司的模型委员会希望在创建派生指标时统一并规范指标的名称,因此在DWS数仓分层中设置了按照时间周期_修饰词_原子指标顺序来组织指标中文名称的强规则。当开发者在该数仓分层中新建中文名称为近1天_A门店_用户数量近30天_北京市_B商品_销售金额A门店_用户数量_近7天A门店_用户数量的派生指标时,保存指标将触发命名规则的检测,检测结果如下表所示。

    指标名称

    是否符合数仓分层的命名规范

    近1天_A门店_用户数量

    匹配

    近30天_北京市_B商品_销售金额

    匹配

    A门店_用户数量_近7天

    不匹配

    A门店_用户数量

    不匹配

后续步骤

数仓分层检查器配置完成后,您可继续进行数仓规划中的数据域、业务过程与业务分类的规划和创建。详情请参见数据域业务过程业务分类