標籤工廠是通過從標籤建立到服務全鏈路的構建,為企業資料研發團隊以及開發工程師提供一站式標籤開發以及服務平台,適合多種情境(如風控、營銷),提供離線、即時、服務標籤的開發、管理、探索以及服務能力,賦能上層各端業務應用,為企業沉澱標籤資產,使標籤開發高效、好找、好用、好管理。
前提條件
已購買標籤工廠增值服務並且當前租戶已開通標籤工廠模組。
使用限制
標籤工廠支援的離線計算引擎有MaxCompute、CDH6.x Hadoop、CDH5.x Hadoop、FusionInsight 8.x Hadoop、TDH 6.x 、ArgoDB、Cloudera Data Platform 7.x。
離線計算引擎為CDH6.x Hadoop、CDH5.x Hadoop和TDH 6.x時,僅支援開源FlinkRealtime Compute引擎進列標籤即時任務開發。
功能介紹
Dataphin標籤工廠基於離線計算引擎、即時(流)計算引擎、資料服務的底層支援,包含標籤開發、標籤尋找、群組圈選、服務應用等核心功能。
業務規劃
實體建立:標籤工廠遵循OLT模型進行實體建模,即實體(Object)、關係(Link)、標籤(Tag)。您可在標籤工廠建立業務實體並與ID(即從不同視角對實體進行的描述)進行綁定,實現實體和ID的映射關係。如使用者編號、員工編號、使用者郵箱等。
ID建立:用於定義實體關聯的ID類型,如消費者、商家等實體關聯的手機號、郵箱等。
標籤開發
定義資料集:在進列標籤開發前,您可通過資料來源建立資料集定義,資料集允許您對資料來源進行預加工。如定義資料集的資料範圍、顯示列等。
行為關係:通過具體的行為定義實體之間的關係,如使用者購買商品通過購買這個行為描述了使用者和商品這兩個實體之間的關係,定義好的行為關係可以用於開發行為統計以及偏好類型的標籤,或者直接用於圈選群組。
標籤加工:標籤是用來描述業務實體特徵的一種資料形式。標籤工廠支援建立離線、即時、服務、進階不同類型的標籤。
群組圈選
對標籤、行為關係、群組進行按條件分類,實現目標群體的精準定位和分析。如將年齡小於18歲的使用者,劃分為未成年使用者群。
服務應用
資產市場:用於管理在工作台中開發好並上架到市場的標籤以及群組。
資產應用:用於管理市場上申請的標籤和群組以及建立的服務。
標籤工廠入口
在Dataphin首頁,單擊頂部功能表列標籤。預設進入標籤工廠的資產市場頁面。
