本教程將從前期的資源準備、數倉規劃,到後期的營運補資料、查看運行結果,指導您如何使用Dataphin完成基本的離線數倉構建。以協助您快速瞭解Dataphin離線數倉建設的基礎流程。
使用Dataphin進行離線數倉建設的基本流程如下:
主流程 | 描述 | 操作指導 |
準備工作 | 使用Dataphin進行離線數倉建設前您需完成相關雲資源的準備。雲資源準備包括阿里雲帳號資源準備、Dataphin開通與AccessKey配置、MaxCompute計算源的開通與配置、以及資料來源的準備。 | |
規劃數倉 | 數倉規劃是資料建設中的藍圖,在您開始資料開發前,需要完成資料倉儲的規劃,數倉規劃配置包括:建立資料板塊和主題域、計算源、資料來源、專案及專案中的成員。 | |
Data Integration | 將建立好的資料來源整合至專案。 | |
規範定義 | 基於Dataphin資料研發模組,明確統計指標口徑並完成配置開發,相關的定義包括業務對象、商務活動、原子指標、業務限定和派生指標。 | |
規範建模 | 基於規範定義部分定義好的概念以及Dataphin的規範建模功能圈定來來源資料,並完成模型建設。 | |
資料開發 | 基於規範定義明確好的統計指標口徑和規範建模部分定義好的模型完成規範建模資料開發。包括維度邏輯表、事實邏輯表、原子指標、業務限定、派生指標。 | |
營運補資料 | 對任務進行資料回刷,包括管道任務、維度邏輯表、事實邏輯表以及指標。 | |
驗證資料 | 您可以通過即席查詢來驗證資料的正確性。 |