Dataphin標籤支援通過計算指令碼方式對HBase資料來源表欄位進行解析,定義資料集指標。本文將指導您如何通過HBase資料來源建立和配置即時資料集。
前提條件
建立即時資料集前請先建立資料集所歸屬的標籤專案。具體操作,請參見建立標籤專案。
通過HBase建立即時資料集請前先建立用於即時資料集的HBase資料來源。具體操作,請參見建立HBase資料來源。
操作步驟
在Dataphin首頁,單擊頂部功能表列的標籤->標籤工作台。
按照以下操作指引,進入新增即時資料集對話方塊。
選擇標籤專案->單擊即時資料集->單擊新增資料集。

在新增即時資料集對話方塊中單擊選擇HBase資料集。

在新增HBase配置頁面,配置資料集的基本資料及加工邏輯。
基本資料
加工邏輯。
變數:使用
${}包裹。樣本,${variable}。字串常量:使用
""包裹。樣本,"hello word"。函數:
md5()參數為字串。樣本,md5("hello word")或者如md5({user_id})。運算式:
+串連多個字串。例如,${user_id} + "hello world"。
參數 | 描述 |
資料集名稱 | 填寫資料集的名稱資訊。支援中英文、數字、底線(_),64個字元以內。 |
資料集code | 即時資料集的唯一標識。在存在相同即時資料集名稱時,可協助您定位具體即時資料集。必須以字母開頭,允許小寫英文字母、數字、底線(_),64個字元以內。 |
負責人 | 請選擇該即時資料集的負責人。 |
描述 | 填寫即時資料集的簡單描述,1000個字元以內。 |
參數 | 描述 |
資料來源 | 選擇所需加工的HBase資料來源。若無可選HBase資料來源,需要進行建立。具體操作,請參見建立HBase資料來源。 |
來源表 | 選擇HBase資料來源中所需加工的來源表。 |
RowKey配置規則 | 配置RowKey規則。 RowKey運算式支援函數與變數: |
主體 | 填寫完成RowKey配置規則後,單擊主體解析,即可解析主體列表。同時,需要為解析出的主鍵名稱配置實值型別。支援字串和長整型。 |
指標配置 | 配置指標的列簇名稱、欄位名稱、欄位類型、指標展示名稱、實值型別和描述資訊。實值型別支援字串、長整型、雙精確度浮點數、日期、布爾、十進位小數。 若需配置多個指標,您可單擊+添加進行配置。 |
單擊發布,完成即時資料集的建立。
儲存成功後,單擊驗證。您可以根據配置的加工邏輯輸入參數值,以驗證您的加工邏輯是否正確。
後續步驟
完成即時資料集的建立和發布後,您可以為即時資料集建立對應的即時標籤。更多資訊,請參見即時標籤概述。