明细表用于存储大量能够体现业务活动状况的实际数据或详细数值,是数据聚合后依据某个维度生成的结果表。例如,分析产品销售情况,您可以创建销售明细表,用来存储产品维度(作为外键)、时间维度(作为外键)以及销售总量。本文为您介绍如何创建明细表。

前提条件

  • 已创建数仓分层。数仓分层是将不同功能作用的表挂载至统一的数据层,方便您查找使用。明细表通常挂载于数据明细层(DWD层),您也可以根据业务需求,选择将明细表挂载至其他数据层。创建数据分层,详情请参见创建数仓分层
  • 已创建业务过程,用来确定明细表需要存储哪类具体业务活动的数据。创建业务过程,详情请参见业务过程

背景信息

结合业务过程的规划,梳理分析各业务过程中可能产生的实际数据,将这些实际数据字段通过明细表的方式存储下来。例如下订单这一业务过程中,您可以创建下订单这一明细表,用于记录下单过程可能产生实际数据字段,例如订单ID、订单创建时间、商品ID、数量、金额等。后续您可将这些明细表部署到数仓中,通过ETL将真实的数据按照明细表的定义方式进行汇总存储,便于业务分析时取用。

事实表如上图所示:
  • 创明细表时:
    • 可以关联本明细表是用于分析哪个业务分类和业务过程,便于后续直接查看具体某一业务分类或业务过程下,有哪些明细表。
    • 可以指定明细表后续在数据建模分析使用时,明细表的数据存储于数仓中的哪个数据分层,一般情况下明细表可存储于数据明细层(DWD层)。
  • 明细表创建后,您可以为明细表添加字段,且可以对明细表进行关联和分区的设置,并且可使用统一的数据标准来进行字段设置,保障全数据域中的数据的属性是一致的。
  • 明细表创建配置完成后,可发布物化至计算引擎,后续在计算引擎中使用明细表进行数据分析。

操作步骤

  1. 进入维度建模
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据开发
    4. 单击左上方的图标图标,选择全部产品 > 数据建模 > 维度建模,默认进入维度建模页面。
  2. 创建明细表。
    1. 维度建模页面,鼠标悬停至加号图标,单击创建明细表
    2. 配置明细表的基本信息。
    事实表
    参数项 描述
    数仓分层 选择已创建的数仓分层,仅支持选择公共层的明细数据层。后续使用此明细表时,明细表中的数据即存储在数仓的这一层中。详情请参见创建数仓分层
    业务过程 已创建完成的业务过程,详情请参见业务过程
    业务分类 已创建的业务分类,详情请参见业务分类
    存储策略 明细表存储数据的策略,可以选择每日增量每日全量等多种策略。
    表名规则 选择已配置的检查器。用于检测表名称是否符合该检查器制定的表命名规则。配置检查器,详情请参见配置数仓分层检查器
    表名 表的内部名称,可由小写英文字母、下划线(_)、数字组成,并且以小写英文字母开头。
    表中文名 表的中文名称,可由中文、英文字母、下划线(_)、数字、and(&)、英文括号组成,并且以中文、英文字母或数字开头。
    生命周期 明细表存在的时间周期。最大可保存36000天。
    表类型 根据实际情况,选择事实事务表周期快照表累加表
    描述 明细表的描述信息。
  3. 配置完成后,单击保存,保存成功后,可在左侧目录树进行查看。

后续步骤

表创建完成后,您仍需为表配置字段管理、关联关系、分区设置等内容,并将表发布至对应环境,详情请参见发布与管理表