全部產品
Search
文件中心

Dataphin:配置IBM DB2輸入組件

更新時間:Jan 25, 2025

IBM DB2輸入組件用於讀取IBM DB2資料來源的資料。同步IBM DB2資料來源的資料至其他資料來源的情境中,您需要先配置IBM DB2輸入組件讀取的來源資料源資訊,再配置資料同步的目標資料來源。本文為您介紹如何配置IBM DB2輸入組件。

前提條件

在開始執行操作前,請確認您已完成以下操作:

操作步驟

  1. 在Dataphin首頁頂部功能表列,選擇研發 > Data Integration

  2. 在整合頁面頂部功能表列選擇專案(Dev-Prod模式需要選擇環境)。

  3. 在左側導覽列中單擊離線整合,在離線整合列表中單擊需要開發的離線管道,開啟該離線管道的配置頁面。

  4. 單擊頁面右上方的組件庫,開啟組件庫面板。

  5. 組件庫面板左側導覽列中需選擇輸入,在右側的輸入組件列表中找到IBM DB2組件,並拖動該組件至畫布。

  6. 單擊IBM DB2輸入組件卡片中的image表徵圖,開啟IBM DB2輸入配置對話方塊。

  7. IBM DB2輸入配置對話方塊,配置參數。

    參數

    描述

    步驟名稱

    即IBM DB2輸入組件的名稱。Dataphin自動產生步驟名稱,您也可以根據業務情境修改。命名規則如下:

    • 只能包含中文、字母、底線(_)、數字。

    • 不能超過64個字元。

    資料來源

    在資料來源下拉式清單中,展示當前Dataphin中所有IBM DB2類型的資料來源,包括您已擁有同步讀許可權的資料來源和沒有同步讀許可權的資料來源。 單擊image表徵圖,可複製當前資料來源名稱。

    對於沒有同步讀許可權的資料來源,您可以單擊資料來源後的申請,申請資料來源的同步讀許可權。具體操作,請參見申請、續期和交還資料來源許可權

    如果您還沒有IBM DB2類型的資料來源,單擊建立資料來源,建立資料來源。具體操作,請參見建立IBM DB2資料來源

    可輸入表名關鍵字進行搜尋,或輸入準確表名後單擊精準尋找。選擇表後,系統將自動進行表狀態檢測。單擊image表徵圖,可複製當前所選表的名稱。

    切分鍵(非必選)

    系統根據配置的切分鍵欄位進行資料分區,可以配合并發度配置使用,實現並發讀取。支援將來源資料表中某一列作為切分鍵。此外,建議使用主鍵或有索引的列作為切分鍵以保證傳輸效能。

    重要

    選擇日期時間類型時,系統會通過識別最大最小值方式,根據總時間範圍和並發度進行暴力切分,不保證平均

    批量讀取條數(非必填)

    一次性讀取資料的條數。在從來源資料庫讀取資料時,可以配置一個特定的批量讀取條數(如1024條記錄),而不是一條一條地讀取,以減少與資料來源之間的互動次數,提高I/O效率,並降低網路延遲。

    輸入過濾(非必填)

    配置抽取資料的篩選條件,配置說明如下:

    • 配置固定值,抽取對應的資料,例如ds=20210101

    • 組態變數參數,抽取某一部分資料,例如ds=${bizdate}

    輸出欄位

    輸出欄位地區展示了已選中表及篩選條件命中的所有欄位。支援進行以下操作:

    • 欄位管理:如果不需要將某些欄位輸出至下遊組件,則您可以刪除對應的欄位:

      • 單個刪除欄位情境:如果需要刪除少量的欄位,則可以單擊操作列下的sgaga表徵圖,刪除多餘的欄位。

      • 大量刪除欄位情境:如果需要刪除大批量欄位,則可以單擊欄位管理,在欄位管理對話方塊選擇多個欄位後,單擊image左移動表徵圖,將已選的輸入欄位移入到未選的輸入欄位並單擊確定,完成欄位的大量刪除。

        image..png

    • 大量新增:單擊大量新增,支援JSON、TEXT格式、DDL格式大量設定

      說明

      大量新增完成,單擊確定後會覆蓋已配置的欄位資訊。

      • 以JSON格式大量設定,例如:

        // 樣本:
          [{
             "index": 1,
             "name": "id",
             "type": "int(10)",
             "mapType": "Long",
             "comment": "comment1"
           },
           {
             "index": 2,
             "name": "user_name",
             "type": "varchar(255)",
             "mapType": "String",
             "comment": "comment2"
         }]
        說明

        index表示指定對象的列編號,name表示引入後的欄位名稱,type表示引入後的欄位類型。 例如,"index":3,"name":"user_id","type":"String"表示把檔案中的第4列引入,欄位名為user_id,欄位類型為String。

      • 以TEXT格式大量設定,例如:

        // 樣本:
        1,id,int(10),Long,comment1
        2,user_name,varchar(255),Long,comment2
        • 行分隔字元用於分隔每個欄位的資訊,預設為分行符號(\n),可支援分行符號(\n)、半形分號(;)、半形句號(.)。

        • 資料行分隔符號用於分隔欄位名與欄位類型,預設半形逗號(,),可支援','欄位類型可預設,預設為','

      • 以DDL格式大量設定,例如:

        CREATE TABLE tablename (
        	user_id serial,
        	username VARCHAR(50),
        	password VARCHAR(50),
        	email VARCHAR (255),
        	created_on TIMESTAMP,
        );
    • 建立輸出欄位:單擊+建立輸出欄位,根據頁面提示填寫欄位類型備忘並選擇映射類型。當前行完成配置後,單擊image表徵圖儲存。

  8. 單擊確認,完成IBM DB2輸入組件的屬性配置。