全部產品
Search
文件中心

Dataphin:通過HBase建立即時資料集

更新時間:Jan 25, 2025

Dataphin標籤支援通過計算指令碼方式對HBase資料來源表欄位進行解析,定義資料集指標。本文將指導您如何通過HBase資料來源建立和配置即時資料集。

前提條件

  • 建立即時資料集前請先建立資料集所歸屬的標籤專案。具體操作,請參見建立標籤專案

  • 通過HBase建立即時資料集請前先建立用於即時資料集的HBase資料來源。具體操作,請參見建立HBase資料來源

操作步驟

  1. 在Dataphin首頁,單擊頂部功能表列的標籤->標籤工作台

  2. 按照以下操作指引,進入新增即時資料集對話方塊。

    選擇標籤專案->單擊即時資料集->單擊新增資料集

    image

  3. 新增即時資料集對話方塊中單擊選擇HBase資料集

    image

  4. 新增HBase配置頁面,配置資料集的基本資料及加工邏輯。

  • 基本資料

  • 參數

    描述

    資料集名稱

    填寫資料集的名稱資訊。支援中英文、數字、底線(_),64個字元以內。

    資料集code

    即時資料集的唯一標識。在存在相同即時資料集名稱時,可協助您定位具體即時資料集。必須以字母開頭,允許小寫英文字母、數字、底線(_),64個字元以內。

    負責人

    請選擇該即時資料集的負責人。

    描述

    填寫即時資料集的簡單描述,1000個字元以內。

  • 加工邏輯

  • 參數

    描述

    資料來源

    選擇所需加工的HBase資料來源。若無可選HBase資料來源,需要進行建立。具體操作,請參見建立HBase資料來源

    來源表

    選擇HBase資料來源中所需加工的來源表。

    RowKey配置規則

    配置RowKey規則。

    RowKey運算式支援函數與變數:

    • 變數:使用${}包裹。樣本,${variable}

    • 字串常量:使用""包裹。樣本,"hello word"

    • 函數md5() 參數為字串。樣本,md5("hello word")或者如md5({user_id})

    • 運算式+串連多個字串。例如,${user_id} + "hello world"

    主體

    填寫完成RowKey配置規則後,單擊主體解析,即可解析主體列表。同時,需要為解析出的主鍵名稱配置實值型別。支援字串長整型

    指標配置

    配置指標的列簇名稱、欄位名稱、欄位類型、指標展示名稱、實值型別和描述資訊。實值型別支援字串、長整型、雙精確度浮點數、日期、布爾、十進位小數

    若需配置多個指標,您可單擊+添加進行配置。

  1. 單擊發布,完成即時資料集的建立。

    說明

    儲存成功後,單擊驗證。您可以根據配置的加工邏輯輸入參數值,以驗證您的加工邏輯是否正確。

後續步驟

完成即時資料集的建立和發布後,您可以為即時資料集建立對應的即時標籤。更多資訊,請參見即時標籤概述