入力コンポーネントで IBM DB2 データを Dataphin バッチパイプラインに同期 - Dataphin

IBM DB2 入力コンポーネントを使用すると、IBM DB2 データソースからデータを読み取ることができます。 IBM DB2 データソースから他の宛先にデータを同期する場合、同期のターゲットデータソースを設定する前に、IBM DB2 入力コンポーネントのソース情報を構成することが不可欠です。このトピックでは、IBM DB2 入力コンポーネントの構成プロセスについて説明します。

前提条件

開始する前に、次の前提条件が満たされていることを確認してください。

IBM DB2 データソースが作成されていること。詳細については、「IBM DB2 データソースを作成する」をご参照ください。
IBM DB2 入力コンポーネントのプロパティを構成するには、アカウントがデータソースに対するリードスルー権限を持っている必要があります。アカウントにこれらの権限がない場合は、データソースの権限を取得する必要があります。詳細については、「データソース権限をリクエスト、更新、および返却する」をご参照ください。

手順

Dataphin ホームページで、トップメニューバーに移動し、[開発] > [data Integration] を選択します。
統合ページの上部で、[プロジェクト] を選択します（開発 - 本番モードで環境を選択します）。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。 [バッチパイプライン] リストから、開発するオフラインパイプラインを選択して、構成ページにアクセスします。
右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。
[コンポーネントライブラリ] パネルの左側のナビゲーションで、[入力] を選択します。次に、右側のリストで [IBM DB2] コンポーネントを見つけて、キャンバスにドラッグします。
IBM DB2 入力コンポーネントカードのアイコンをクリックして、[IBM DB2] [入力構成] ダイアログボックスを開きます。

[IBM DB2 入力構成] ダイアログボックスで、パラメーターを設定します。

パラメーター	説明
[ステップ名]	IBM DB2 入力コンポーネントの名前。 Dataphin は自動的にステップ名を生成します。ビジネスシナリオに基づいて名前を変更することもできます。命名規則は次のとおりです。使用できるのは、漢字、英字、アンダースコア（_）、数字のみです。名前は 64 文字を超えることはできません。
[データソース]	データソースのドロップダウンリストには、Dataphin 内のすべての IBM DB2 データソースが表示されます。これには、リードスルー権限を持つデータソースと、リードスルー権限を持たないデータソースが含まれます。アイコンをクリックして、現在のデータソースの名前をコピーします。リードスルー権限のないデータソースの場合、データソースの横にある [リクエスト] をクリックして、リードスルー権限をリクエストできます。詳細については、「データソース権限をリクエスト、更新、および返却する」をご参照ください。 IBM DB2 データソースがない場合は、[データソースの作成] をクリックして作成します。詳細については、「IBM DB2 データソースを作成する」をご参照ください。
[テーブル]	キーワードを入力してテーブルを検索するか、正確なテーブル名を入力して [完全一致検索] をクリックします。テーブルを選択すると、システムは自動的にテーブルステータスを検出します。アイコンをクリックして、選択したテーブルの名前をコピーします。
[シャードキー]（オプション）	システムは、構成されたシャードキーフィールドに基づいてデータをシャードします。この機能を同時実行構成と併用して、同時読み取りを実現できます。ソースデータテーブルの列をシャードキーとして使用できます。伝送パフォーマンスを確保するために、プライマリキーまたはインデックス付き列をシャードキーとして使用することをお勧めします。重要日付時刻型を選択した場合、システムは最大値と最小値を識別し、合計時間範囲と同時実行性に基づいてブルートフォースシャーディングを実行します。均等な分散は保証されません。
[バッチ読み取り数]（オプション）	一度に読み取るレコードの数。ソースデータベースからデータを読み取るときに、一度に 1 つのレコードを読み取る代わりに、特定のバッチ読み取り数（1,024 レコードなど）を構成できます。これにより、データソースとのインタラクションの回数が減り、I/O 効率が向上し、ネットワーク遅延が減少します。
[入力フィルター]（オプション）	データを抽出するためのフィルター条件を構成します。構成の詳細は次のとおりです。静的フィールドを構成して、対応するデータを抽出します。例：`ds=20210101`。変数パラメーターを構成して、データの特定の部分を抽出します。例：`ds=${bizdate}`。
[出力フィールド]	出力フィールドセクションには、フィルター条件に一致する選択したテーブルのすべてのフィールドが表示されます。次の操作を実行できます。フィールド管理：特定のフィールドをダウンストリームコンポーネントに出力する必要がない場合は、対応するフィールドを削除できます。単一フィールドの削除：少数のフィールドを削除する必要がある場合は、操作列のアイコンをクリックして、余分なフィールドを削除します。複数フィールドの削除：多数のフィールドを削除する必要がある場合は、[フィールド管理] をクリックします。 [フィールド管理] ダイアログボックスで、複数のフィールドを選択し、左矢印アイコンをクリックして、選択した入力フィールドを未選択の入力フィールドに移動してから、[確認] をクリックして、フィールドのバッチ削除を完了します。バッチ追加：[バッチ追加] をクリックして、JSON、TEXT、および DDL 形式のバッチ構成をサポートします。説明バッチ追加が完了した後、[確認] をクリックすると、既存のフィールド情報が上書きされます。 JSON 形式でフィールドをバッチ構成します。例： `// 例： [{ "index": 1, "name": "id", "type": "int(10)", "mapType": "Long", "comment": "comment1" }, { "index": 2, "name": "user_name", "type": "varchar(255)", "mapType": "String", "comment": "comment2" }]` 説明 index はオブジェクトの列番号を指定します。 name はインポート後のフィールドの名前を指定します。 type はインポート後のフィールドの型を指定します。例えば、`"index":3,"name":"user_id","type":"String"` は、ファイルの 4 番目の列がインポートされることを示しています。フィールド名は user_id で、フィールドタイプは String です。 TEXT 形式でフィールドをバッチ構成します。例： `// 例： 1,id,int(10),Long,comment1 2,user_name,varchar(255),Long,comment2` 行区切り文字は、各フィールドの情報を区切るために使用されます。デフォルトは改行（\n）です。サポートされている区切り文字には、改行（\n）、セミコロン（;）、ピリオド（.）が含まれます。列区切り文字は、フィールド名とフィールドタイプを区切るために使用され、デフォルトは半角カンマ（,）です。 ',' をサポートしています`。` フィールドタイプは省略でき、デフォルトは ',' です。`','` DDL 形式でフィールドをバッチ構成します。例： `CREATE TABLE tablename ( user_id serial, username VARCHAR(50), password VARCHAR(50), email VARCHAR (255), created_on TIMESTAMP, );` 新しい出力フィールドの作成：[+ 出力フィールドの作成] をクリックします。ページの指示に従って、[列]、[タイプ]、[コメント] を入力し、[マッピングタイプ] を選択します。現在の行の構成が完了したら、アイコンをクリックして保存します。

[確認] をクリックして、IBM DB2 入力コンポーネントのプロパティ構成を完了します。