全部產品
Search
文件中心

Dataphin:離線數倉構建流程

更新時間:Jan 25, 2025

本教程將從前期的資源準備、數倉規劃,到後期的營運補資料、查看運行結果,指導您如何使用Dataphin完成基本的離線數倉構建。以協助您快速瞭解Dataphin離線數倉建設的基礎流程。

使用Dataphin進行離線數倉建設的基本流程如下:

主流程

描述

操作指導

準備工作

使用Dataphin進行離線數倉建設前您需完成相關雲資源的準備。雲資源準備包括阿里雲帳號資源準備、Dataphin開通與AccessKey配置、MaxCompute計算源的開通與配置、以及資料來源的準備。

步驟一:準備工作

規劃數倉

數倉規劃是資料建設中的藍圖,在您開始資料開發前,需要完成資料倉儲的規劃,數倉規劃配置包括:建立資料板塊和主題域、計算源、資料來源、專案及專案中的成員。

步驟二:規劃數倉

Data Integration

將建立好的資料來源整合至專案。

步驟三:引入資料

規範定義

基於Dataphin資料研發模組,明確統計指標口徑並完成配置開發,相關的定義包括業務對象、商務活動、原子指標、業務限定和派生指標。

步驟四:規範定義

規範建模

基於規範定義部分定義好的概念以及Dataphin的規範建模功能圈定來來源資料,並完成模型建設。

步驟五:規範建模

資料開發

基於規範定義明確好的統計指標口徑和規範建模部分定義好的模型完成規範建模資料開發。包括維度邏輯表、事實邏輯表、原子指標、業務限定、派生指標。

  1. 步驟一:開發維度邏輯表

  2. 步驟二:開發事實邏輯表

  3. 步驟三:開發原子指標

  4. 步驟四:開發業務限定

  5. 步驟五:開發指標

營運補資料

對任務進行資料回刷,包括管道任務、維度邏輯表、事實邏輯表以及指標。

步驟七:營運補資料

驗證資料

您可以通過即席查詢來驗證資料的正確性。

步驟八:驗證資料