Log Service輸入組件用於讀取Log Service資料來源的資料。同步Log Service資料來源的資料至其他資料來源的情境中,您需要先配置Log Service輸入組件讀取的資料來源,再配置資料同步的目標資料來源。本文為您介紹如何配置Log Service輸入組件。
前提條件
已建立Log Service資料來源。具體操作,請參見建立Log Service資料來源。
進行Log Service輸入組件屬性配置的帳號,需具備該資料來源的同步讀許可權。如果沒有許可權,則需要申請資料來源許可權。具體操作,請參見申請、續期和交還資料來源許可權。
操作步驟
在Dataphin首頁頂部功能表列,選擇研發 > Data Integration。
在整合頁面頂部功能表列選擇專案(Dev-Prod模式需要選擇環境)。
在左側導覽列中單擊離線整合,在離線整合列表中單擊需要開發的離線管道,開啟該離線管道的配置頁面。
單擊頁面右上方的組件庫,開啟組件庫面板。
在組件庫面板左側導覽列中需選擇輸入,在右側的輸入組件列表中找到Log Service組件,並拖動該組件至畫布。
單擊Log Service輸入組件卡片中的
表徵圖,開啟Log Service輸入配置對話方塊。在Log Service輸入配置對話方塊,配置參數。
參數
描述
步驟名稱
即Log Service輸入組件的名稱。Dataphin自動產生步驟名稱,您也可以根據業務情境修改。命名規則如下:
只能包含中文、字母、底線(_)、數字。
不能超過64個字元。
資料來源
在資料來源下拉式清單中,展示所有Log Service類型的資料來源,包括您已擁有同步讀許可權的資料來源和沒有同步讀許可權的資料來源。單擊
表徵圖,可複製當前資料來源名稱。對於沒有同步讀許可權的資料來源,您可以單擊資料來源後的申請,申請資料來源的同步讀許可權。具體操作,請參見申請、續期和交還資料來源許可權。
如果您還沒有Log Service類型的資料來源,單擊建立,建立資料來源。具體操作,請參見建立Log Service資料來源。
表
可輸入表名關鍵字進行搜尋,或輸入準確表名後單擊精準尋找。單擊
表徵圖,可複製當前所選表的名稱。單擊
表徵圖,可複製當前所選表的名稱。 日誌開始時間
填寫讀取日誌的開始時間。時間格式為
yyyyMMddHHmmss。日誌結束時間
填寫讀取日誌的結束時間。時間格式為
yyyyMMddHHmmss。批量讀取條數
一次性讀取資料的條數。在從來源資料庫讀取資料時,可以配置一個特定的批量讀取條數(如1024條記錄),而不是一條一條地讀取,以減少與資料來源之間的互動次數,提高I/O效率,並降低網路延遲。
輸出欄位
為您展示輸出欄位。
大量新增欄位。
單擊大量新增。
以JSON格式大量設定。樣本如下:
// 樣本: [{ "index": 0, "name": "user_id", "type": "String" }, { "index": 1, "name": "user_name", "type": "String" }]說明index表示指定對象的列編號,name表示引入後的欄位名稱,type表示引入後的欄位類型。例如,
"index":3,"name":"user_id","type":"String"表示把檔案中的第4列引入,欄位名為user_id,欄位類型為String。以TEXT格式大量設定,樣本如下:
// 樣本: 0,user_id,String 1,user_name,String行分隔字元用於分隔每個欄位的資訊,預設為分行符號(\n),可支援分行符號(\n)、分號(;)、點(.)。
資料行分隔符號用於分隔欄位名與欄位類型,預設英文逗號(,)。
單擊確定。
建立輸出欄位。
單擊建立輸出欄位,填寫來源序號、欄位及選擇欄位的類型,單擊空白處即完成欄位建立。
管理輸出欄位。
您可以對已添加的欄位執行如下操作:
單擊拖動欄位旁的
表徵圖,可調換欄位所處位置。單擊操作列下的
表徵圖,編輯已有的欄位。單擊操作列下的
表徵圖,刪除已有的欄位。
單擊確認,完成Log Service輸入組件的屬性配置。