SelectDB 入力による信頼性の高いバッチデータ同期の設定 - Dataphin

SelectDB 入力コンポーネントは、SelectDB データソースからデータを読み取ります。SelectDB データソースから別のデータソースにデータを同期する場合、まずソースデータソースの情報で SelectDB 入力コンポーネントを設定します。次に、同期タスクの送信先データソースを設定します。このトピックでは、SelectDB 入力コンポーネントの設定方法について説明します。

前提条件

SelectDB データソースが作成済みであること。詳細については、「SelectDB データソースの作成」をご参照ください。
SelectDB 入力コンポーネントの設定に使用するアカウントには、データソースに対する同期読み取り権限が必要です。アカウントにこの権限がない場合は、権限をリクエストしてください。詳細については、「データソース権限のリクエスト」をご参照ください。

操作手順

Dataphin のホームページの上部メニューバーで、[開発] > [データ統合] を選択します。
統合ページの上部メニューバーで、[プロジェクト] を選択します。Dev-Prod モードでは、環境も選択します。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] リストで、開発したいオフラインパイプラインをクリックします。パイプラインの設定ページが開きます。
ページの右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。
[コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[入力] をクリックします。右側の入力コンポーネントリストで [SelectDB] コンポーネントを見つけ、キャンバスにドラッグします。
SelectDB 入力コンポーネントカードのアイコンをクリックして、[SelectDB] [入力設定] ダイアログボックスを開きます。

[SelectDB 入力設定] ダイアログボックスで、パラメーターを設定します。

パラメーター	説明
ステップ名	SelectDB 入力コンポーネントの名前です。Dataphin はステップ名を自動的に生成します。ビジネスシナリオに基づいて変更できます。次の命名規則を使用してください：漢字、英字、アンダースコア (_)、数字のみを使用します。 64 文字以内で入力してください。
データソース	データソースのドロップダウンリストには、現在の Dataphin インスタンス内のすべての SelectDB データソースが表示され、それぞれに対するリードスルー権限の有無が示されます。データソースに対する同期読み取り権限がない場合は、データソースの横にある [リクエスト] をクリックして権限をリクエストします。詳細については、「データソース権限のリクエスト」をご参照ください。 SelectDB データソースがない場合は、[データソースの作成] をクリックして作成します。詳細については、「SelectDB データソースの作成」をご参照ください。
[ソーステーブル数]	ソーステーブルの数を選択します。オプションは [単一テーブル] と [複数テーブル] です： [単一テーブル]：1 つのソーステーブルから 1 つの送信先テーブルにビジネスデータを同期する場合に、このオプションを使用します。 [複数テーブル]：複数のソーステーブルから 1 つの送信先テーブルにビジネスデータを同期する場合に、このオプションを使用します。複数のテーブルから 1 つのテーブルにデータを書き込む際、システムは UNION アルゴリズムを使用します。
[テーブル照合メソッド]	[汎用ルール] または [データベース正規表現] を選択します。説明このパラメーターは、[ソーステーブル数] で [複数テーブル] を選択した場合にのみ使用できます。
テーブル	ソーステーブルを選択します： [ソーステーブル数] で [単一テーブル] を選択した場合、テーブル名フィールドにキーワードを入力して検索します。または、正確なテーブル名を入力して [完全一致] をクリックします。テーブルを選択すると、システムが自動的にそのステータスを確認します。アイコンをクリックして、選択したテーブルの名前をコピーします。 [ソーステーブル数] で [複数テーブル] を選択した場合、テーブル照合メソッドに基づいて式を入力します： [汎用ルール] を選択した場合：フィールドに式を入力して、同じ構造のテーブルをフィルターします。システムは、列挙、正規表現風の構文、および混合フォーマットをサポートしています。例：`table_[001-100];table_102;`. [データベース正規表現] を選択した場合：データベースでサポートされている正規表現を入力します。システムはこの正規表現を使用して、ターゲットデータベース内のテーブルを照合します。ランタイムに、タスクは正規表現に基づいて新しいテーブルを動的に照合します。式を入力した後、[完全一致] をクリックします。[一致詳細の確認] ダイアログボックスで、一致したテーブルのリストを表示します。
[分割キー] (オプション)	一度に読み取るレコードの数です。バッチサイズ (例：1,024 レコード) を設定して、ソースデータベースから一度に 1 レコードずつではなく、バッチでデータを読み取ります。これにより、データソースとのやり取りが減り、I/O 効率が向上し、ネットワーク遅延が低減します。
[バッチ読み取りサイズ] (オプション)	一度に読み取るレコードの数です。バッチサイズ (例：1,024 レコード) を設定して、ソースデータベースから一度に 1 レコードずつではなく、バッチでデータを読み取ります。これにより、データソースとのやり取りが減り、I/O 効率が向上し、ネットワーク遅延が低減します。
[入力フィルター] (任意)	抽出するデータをフィルターするための条件を設定します。次のように設定します：静的な値を設定して、一致するデータを抽出します。例：`ds=20210101`。変数パラメーターを設定して、データの一部を抽出します。例：`ds=${bizdate}`。
出力フィールド	[出力フィールド] セクションには、選択したテーブルとフィルターからのすべてのフィールドがリストされます。次の操作を実行できます：フィールドの管理：下流コンポーネントに渡す必要のないフィールドを削除します： 1 つのフィールドを削除：いくつかのフィールドを削除するには、[操作] 列のアイコンをクリックします。複数のフィールドを削除：多くのフィールドを削除するには、[フィールド管理] をクリックします。[フィールド管理] ダイアログボックスで、複数のフィールドを選択します。左矢印アイコンをクリックして、選択したフィールドを未選択リストに移動します。[OK] をクリックして、一括削除を完了します。バッチ追加：[バッチ追加] をクリックして、JSON、TEXT、または DDL フォーマットでフィールドを追加します。説明 OK をクリックすると、バッチ追加されたフィールドは既存のフィールド設定を上書きします。 JSON フォーマットを使用してバッチで設定を構成します。例： `// 例： [{ "index": 1, "name": "id", "type": "int(10)", "mapType": "Long", "comment": "comment1" }, { "index": 2, "name": "user_name", "type": "varchar(255)", "mapType": "String", "comment": "comment2" }]` 説明 `index` フィールドは指定されたオブジェクトの列番号を示し、`name` フィールドはインポート後のフィールド名を示し、`type` フィールドはインポート後のフィールドタイプを示します。たとえば、`"index":3,"name":"user_id","type":"String"` は、ファイルの 4 番目の列をインポートし、フィールド名を `user_id` に設定し、フィールドタイプを `String` に設定します。 TEXT フォーマットでバッチ設定を実行できます。例： `// 例： 1,id,int(10),Long,comment1 2,user_name,varchar(255),Long,comment2` 行区切り文字は、各フィールドの情報を区切ります。デフォルトは改行 (\n) です。セミコロン (;) またはピリオド (.) も使用できます。列区切り文字は、フィールド名と型を区切ります。デフォルトはコンマ (,) です。`','` も使用できます。フィールドタイプはオプションで、デフォルトは `','` です。 DDL フォーマットでのバッチ設定。例： `CREATE TABLE tablename ( user_id serial, username VARCHAR(50), password VARCHAR(50), email VARCHAR (255), created_on TIMESTAMP, );` 新しい出力フィールドの追加：[+出力フィールドの追加] をクリックします。[列]、[型]、[コメント] の値を入力します。[マッピングタイプ] を選択します。アイコンをクリックして行を保存します。

[OK] をクリックして、SelectDB 入力コンポーネントの設定を完了します。