全部產品
Search
文件中心

Dataphin:建立資料板塊

更新時間:Jan 25, 2025

資料板塊是邏輯空間的重要組成部分,是基於業務特徵劃分的命名空間。在使用規範建模前,您需要完成資料板塊的建立。本文為您介紹如何建立資料板塊。

前提條件

  • 僅支援智能研發版。若需使用,當前租戶還需開通智能研發模組

  • 在開始執行操作前,請確認您已將資料板塊架構師業務負責人資料負責人添加至Dataphin成員列表。具體操作請參見添加Dataphin成員

許可權說明

僅支援超級管理員系統管理員建立資料板塊。

功能概述

為了更好地滿足業務訴求,Dataphin支援建立Dev-Prod模式或Basic模式的資料板塊。

  • Dev-Prod模式:產生相互隔離的Dev環境和Prod環境,加強保障Prod環境的資料安全。如果您管理訴求較強,資料研發人員較多且能力及分工明確,資料計算儲存預算較高,推薦使用此模式。

  • Basic模式:產生開發與營運一體化的Prod環境,資料生產過程穩定且便捷。如果您關注資料研發效率,研發人員職能邊界模糊,計算儲存預算有限制,推薦使用此模式。

操作步驟

  1. 在Dataphin首頁,單擊頂部功能表列的規劃。預設進入資料架構頁面。

  2. 資料架構頁面,單擊+建立資料板塊image

  3. 建立資料板塊設定精靈頁面,配置資料板塊資訊。

    1. 步驟一:選擇生產開發類型。

      1. 根據您的實際需求,選擇對應生產開發類型

        • Dev-Prod 模式如您管理訴求較強,資料研發人員較多且能力及分工明確,資料計算儲存預算較高,推薦此模式。Dev環境和Prod環境邏輯隔離,可加強對資料研發流程的管控,強控制生產資料的許可權,最大化保障資料生產穩定性。但是研發流程靈活及便捷性較低,對研發人員工具使用熟練度要求較高,需要配置雙份計算儲存資源。

        • Basic 模式如您關注資料研發效率而非強管控,研發人員職能邊界相對模糊,計算儲存預算有限制,推薦此模式。開發與營運一體化的Prod環境,可敏捷管理資料研發流程,強控制生產資料的寫入權限,平衡資料生產穩定性與靈活性。Basic模式存在直接變更生產環境的風險,請謹慎管理專案成員,控制生產資料穩定性。

          重要

          生產開發類型若選擇Basic 模式,資料板塊建立完成後則不支援升級為Dev-Prod 模式

      2. 單擊下一步

    2. 步驟二:配置板塊定義。

      1. 參考下方表格,配置資料板塊的基礎資訊和商務資訊。

        參數

        描述

        基礎資訊

        板塊英文名

        資料板塊英文名。命名規則如下:

        • 只能包含英文字母大小寫、數字和底線(_)。

        • 長度不超過64個字元。

        完成資料板塊建立後,Dev環境中資料板塊的英文名格式為LD_{自訂的板塊英文名}_dev

        後續如果資料板塊內已有邏輯表產生,不可編輯英文名,以避免影響資料生產。

        板塊名稱

        資料板塊名稱。命名規則如下:

        • 只能包含中文、數字、英文字母大小寫、底線(_)和短劃線(-)。

        • 長度不超過64個字元。

        完成資料板塊建立後,Dev環境中資料板塊的名稱格式為{自訂的板塊名稱}_開發

        描述資訊(非必填)

        填寫對資料板塊的簡單描述,長度不超過128個字元。

        表徵圖

        資料板塊的表徵圖便於您進行業務分類,對於後續資料的計算沒有影響。

        支援選擇的表徵圖包括電商表徵圖)、金融表徵圖)、雲端運算表徵圖)、廣告營銷表徵圖)、物流表徵圖)、文娛表徵圖)、出行表徵圖)、健康表徵圖)、社交&通訊表徵圖)、餐飲表徵圖)、教育表徵圖)和環境表徵圖)。

        商務資訊

        板塊架構師

        負責板塊資訊設定,包括更新基本資料、商務資訊等。支援選擇Dataphin成員列表的所有正常使用的成員。

        業務負責人

        (非必選)

        負責板塊資料的穩定性。支援在列表中選擇最多3位成員。

        資料負責人(非必選)

        負責板塊資料的品質。支援在列表中選擇最多3位成員。

      2. 單擊下一步

    3. 步驟三:配置邏輯表命名規範。

      建立邏輯表時,系統基於邏輯表命名規範自動預產生推薦的邏輯表名稱,您可以編輯為其他任意名稱。

      說明

      資料板塊建立後,可以在資料板塊的研發規範->表規範->邏輯表命名規範進行編輯。修改表首碼將對同一個邏輯表大類的全部子類型生效。例如,修改維度邏輯表大類,將對普通維度邏輯表、層級維度邏輯表等子類型生效。

      預設的命名規範與尾碼如下:

      邏輯表類型

      預設值

      維度邏輯表

      • 表首碼dim_

      • 資料時效(尾碼):

        • 普通維度邏輯表:

          • 天(T+1):無。

          • 小時(T+h):_hf

          • 分鐘(T+m):_mf

        • 層級維度邏輯表:

          • 天(T+1):層級lvl[n][n]為層級數。

        • 枚舉維度邏輯表虛擬維度邏輯表

          • 天(T+1):無。

      事實邏輯表

      • 表首碼fct_

      • 資料時效(尾碼):

        • 流程事實邏輯表

          • 天(T+1):無。

        • 事件事實邏輯表:

          • 天(T+1):_di

          • 小時(T+h):_hi

          • 分鐘(T+m):_mi

        • 快照事實邏輯表:

          • 天(T+1):_df

          • 小時(T+h):_hf

          • 分鐘(T+m):_mf

      • 主題域縮寫:預設關閉,開啟將預設補充主題域縮寫。

      匯總邏輯表

      • 表首碼dws_

      • 資料時效(尾碼):

        • 天(T+1):無。

        • 小時(T+h):_hh

        • 分鐘(T+m):_mm

  4. 單擊確定,完成資料板塊的建立。

後續步驟

完成資料板塊建立後,需要為資料板塊建立主題域。具體操作請參見建立主題域