バッチパイプライン入力コンポーネントによる openGauss ソースデータの同期 - Dataphin

openGauss 入力コンポーネントは、openGauss データソースからデータを読み取ります。openGauss データソースから別のデータソースへデータを同期するには、まず openGauss 入力コンポーネントを構成してソースデータを読み取り、その後ターゲットデータソースを構成します。本トピックでは、openGauss 入力コンポーネントの構成方法について説明します。

前提条件

openGauss データソースが作成されました。詳細については、「openGauss データソースの作成」をご参照ください。
openGauss 入力コンポーネントの構成に使用するアカウントは、データソースに対してリードスルー権限を有している必要があります。必要な権限がない場合は、権限の付与を依頼してください。詳細については、「データソース権限の依頼、更新、返却」をご参照ください。

操作手順

Dataphin のホームページ上部のメニューバーから、[開発] → [データ統合] を選択します。
データ統合ページの上部メニューバーで、[プロジェクト] を選択します。Dev-Prod モードの場合は、環境も併せて選択する必要があります。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] 一覧から、開発対象のバッチパイプラインをクリックし、その構成ページを開きます。
ページ右上隅の [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。
[コンポーネントライブラリ] パネルの左側ナビゲーションウィンドウで、[入力] を選択します。右側の入力コンポーネント一覧から openGauss コンポーネントを見つけ、キャンバスへドラッグします。
openGauss 入力コンポーネントカード上のアイコンをクリックして、openGauss [入力構成] ダイアログボックスを開きます。

[openGauss 入力構成] ダイアログボックスで、パラメーターを構成します。

パラメーター	説明
ステップ名	openGauss 入力コンポーネントの名前です。Dataphin が自動的にステップ名を生成しますが、必要に応じて変更可能です。命名規則は以下のとおりです：中国語文字、英字、アンダースコア (_ )、数字のみ使用可能です。最大長は 64 文字です。
データソース	ドロップダウンリストには、現在の Dataphin プロジェクト内のすべての openGauss データソースが表示されます。これは、ご利用のアカウントがリードスルー権限を持つデータソースおよび権限を持たないデータソースの両方を含みます。現在のデータソース名をコピーするには、アイコンをクリックします。リードスルー権限がないデータソースについては、該当データソース横の [依頼] をクリックして権限を依頼してください。詳細については、「データソース権限の依頼、更新、返却」をご参照ください。 openGauss データソースが存在しない場合は、[作成] をクリックして新規作成してください。詳細については、「openGauss データソースの作成」をご参照ください。
スキーマ	クロススキーマテーブル読み取りがサポートされています。ソーステーブルが配置されているスキーマを選択します。
ソーステーブル数	ソーステーブルの数を選択します。「単一テーブル」および「複数テーブル」のいずれかを選択できます：単一テーブル：1 つのテーブルから 1 つのターゲットテーブルへデータを同期する場合に使用します。複数テーブル：複数のテーブルから 1 つのターゲットテーブルへデータを同期する場合に使用します。複数のテーブルのデータを 1 つのテーブルに書き込む際には、UNION アルゴリズムが使用されます。
テーブル一致パターン	一般ルールまたはデータベース正規表現を選択します。説明このパラメーターは、「ソーステーブル数」が「複数テーブル」に設定されている場合のみ利用可能です。
テーブル	ソーステーブルまたはテーブル一覧を選択します：「ソーステーブル数」が「単一テーブル」に設定されている場合、キーワードを入力してテーブル名を検索するか、正確なテーブル名を入力して [完全一致] をクリックします。テーブルを選択すると、システムが自動的にそのステータスを確認します。選択したテーブル名をコピーするには、アイコンをクリックします。「ソーステーブル数」が「複数テーブル」に設定されている場合、選択した一致パターンに基づいてテーブルを追加する式を入力します。「テーブル一致パターン」が「一般ルール」に設定されている場合、入力欄に式を入力して「同じ構造を持つテーブル」をフィルターします。システムは列挙、正規表現風のパターン、およびその混合をサポートします。例：`table_[001-100];table_102;`。「テーブル一致パターン」が「データベース正規表現」に設定されている場合、現在のデータベースでサポートされる正規表現を入力します。システムはこの式を使用して、ターゲットデータベース内のテーブルを照合します。実行時、ノードはデータベース正規表現に基づいて新しい範囲のテーブルを照合し、同期を実行します。式を入力後、[完全一致] をクリックして、[一致詳細の確認] ダイアログボックスで照合されたテーブル一覧を表示します。
分割キー	ソーステーブルの整数型カラムを分割キーとして使用します。「プライマリキー」または「インデックス付きカラム」を分割キーとして推奨します。データ読み取り時に、システムは構成された分割キーに基づいてデータをパーティション分割し、同時読み取りを可能にします。これにより、データ同期の効率が向上します。
バッチ読み取りサイズ	1 回の読み取りで取得するレコード数です。ソースデータベースから読み取る際には、1 レコードずつではなく、1024 レコードなど特定のバッチサイズを設定します。これにより、データソースとのやり取りが削減され、I/O 効率が向上し、ネットワーク遅延が低減されます。
入力フィルター	入力に対するフィルター条件を入力します。例：`ds=${bizdate}`。「入力フィルター」は、以下のシナリオに適しています：固定範囲のデータ。パラメーターによるフィルタリング。
出力フィールド	「出力フィールド」セクションには、選択したテーブルからフィルター条件に一致するすべてのフィールドが表示されます。以下の操作がサポートされています：フィールド管理：特定のフィールドを下流コンポーネントに出力しない場合は、不要なフィールドを削除できます。単一フィールドの削除：[操作] 列のアイコンをクリックして、不要なフィールドを削除します。複数のフィールドをバッチで削除するには: 「[フィールド管理]」をクリックします。[フィールド管理] ダイアログボックスで、複数のフィールドを選択し、左矢印アイコンをクリックして、選択した入力フィールドを未選択の入力フィールド一覧に移動し、その後、「[OK]」をクリックします。一括追加: [一括追加] をクリックして、JSON、TEXT、またはDDLフォーマットを使用してフィールドを一括で設定します。説明フィールドを一括追加して [OK] をクリックすると、既存のフィールド設定が上書きされます。 JSON 形式での構成例： `// 例: [{ "index": 1, "name": "id", "type": "int(10)", "mapType": "Long", "comment": "comment1" }, { "index": 2, "name": "user_name", "type": "varchar(255)", "mapType": "String", "comment": "comment2" }]` 説明 index は対象の列番号を指定します。name はインポート後のフィールド名を指定します。type はインポート後のフィールド型を指定します。例：`"index":3,"name":"user_id","type":"String"` は、ファイルの 4 列目をフィールド名 user_id、フィールド型 String でインポートすることを意味します。 TEXT 形式での構成例： `// 例: 1,id,int(10),Long,comment1 2,user_name,varchar(255),Long,comment2` 行区切り文字は各フィールドの情報を区切ります。デフォルトの区切り文字は改行 (\n) ですが、セミコロン (;) やピリオド (.) もサポートされます。列区切り文字はフィールド名とフィールド型を区切ります。デフォルトは半角カンマ (,) です。カンマ (,)`','`がサポートされます。フィールド型は省略可能で、デフォルト値は`','`です。 DDL 形式での構成例： `CREATE TABLE tablename ( user_id serial, username VARCHAR(50), password VARCHAR(50), email VARCHAR (255), created_on TIMESTAMP, );` 出力フィールドの作成: [+ 出力フィールドの作成] をクリックします。画面の指示に従って、[列]、[タイプ]、[コメント] を入力し、[マッピングタイプ] を選択します。現在の行を設定した後、アイコンをクリックして保存します。

[確認] をクリックして、openGauss 入力コンポーネント の構成を保存します。