原子指標是對指標統計口徑、具體演算法的抽象。Dataphin創新性地提出了設計即開發的理念,指標定義同時也明確了設計統計口徑(即計算邏輯),提升了研發效率,並保證了統計結果的一致性。本文為您介紹如何建立原子指標。
前提條件
已完成業務實體的建立,具體操作請參見建立並管理業務實體。
操作步驟
在Dataphin首頁,單擊頂部功能表列研發。預設進入資料開發頁面。
在頂部功能表列中選擇專案(Dev-Prod模式需要選擇環境)。
在左側導覽列中選擇規範建模 > 原子指標。
在原子指標列表中單擊
表徵圖,選擇建立原子指標。在建立原子指標對話方塊,配置參數。
配置基本資料地區參數。
參數
描述
業務實體
選擇業務對象或商務活動。
主題域
預設選中業務對象或商務活動所在的主題域。
英文名稱
輸入英文名稱時,Dataphin將根據輸入資料即時匹配資料標準中已配置的詞根,您可以選擇推薦的詞根作為業務實體的英文名稱。更多資訊,請參見建立和管理詞根。

英文名稱需要滿足以下命名規則:
僅支援字母、數字或底線(_)。
不能超過64個字元。
中文名稱
命名規則如下:
支援任何字元。
不超過128個字元。
度量單位
選擇原子指標的度量單位。包括貨幣單位、時間單位、比例單位、名次、對象量詞、重量單位和其他。
貨幣單位:分(人民幣)、元(人民幣)、萬元(人民幣)、百萬元(人民幣)、千萬元(人民幣)、億元(人民幣)、分(美元)、元(美元)、元(歐元)、元(港幣)。
時間單位:天、月、周、年、小時、分鐘、秒、季度、毫秒。
比例單位:小數、百分位元、千分位元。
名次:排名(名次)。
對象量詞:戶、筆、件、個、次、人日、家、手、張、包。
重量單位:噸、公斤。
其他:其他。
資料類型
選擇原子指標的資料類型。包括string、bigint、double、datetime、timestamp、decimal、文本(varchar、char)、數值(int、smallint、tinyint、float)、日期時間(date)、其他(boolean、binary)。
指標口徑
輸入指標口徑,即對指標的定義和加工邏輯等使用自然語言來描述,便於業務人員理解指標加工邏輯。例如:
訂單總量:即門店的有效訂單總數,排除異常和未完結的訂單。指標口徑不超過1000個字元。描述
填寫對原子指標的簡單描述,不超過1000個字元。
配置計算邏輯地區參數。
您可以根據業務情況為原子指標選擇資料時效並配置計算邏輯,資料時效包括天、小時和分鐘。
參數
描述
來源主表
選擇來源表。為保證建模標準規範,來源表僅支援維度邏輯表或事實邏輯表。
統計周期標識
統計周期標識可指定某一個事件(業務過程)的發生時間欄位。僅支援流程事實邏輯表(df表)和維度邏輯表,不支援事件事實邏輯表(di表)(也可以理解為預設為ds分區欄位)。
計算邏輯
編寫定義原子指標的計算邏輯。例如
count(distinct order_id),其中order_id為來源邏輯表模型中的欄位。說明單擊可應用列表中的欄位,可將欄位添加到計算邏輯編輯器中。
是否可累加
是否可累加是指在相同統計粒度下指標(派生指標)相加是否有業務含義或符合商務規則。一般來說,去重計數的指標是不可累加的。
例如,使用者粒度下的成交金額累加是有業務含義的,張三的成交金額100,李四的成交金額200,即兩人共成交 300;產品粒度下的購買人數累加在業務上就沒有意義,A品牌手機的購買者100,B品牌手機的購買者50,這個150可能被放大了,因為有人可能同時買了兩種產品,相加就將這個人多算了一次。
配置完成後,單擊儲存並提交,提交原子指標。