PostgreSQL 出力コンポーネントは、PostgreSQL データソースにデータを書き込みます。他のデータソースからのデータを PostgreSQL データソースに同期するシナリオでは、ソースデータ情報を構成した後、PostgreSQL 出力コンポーネントのターゲットデータソースを構成する必要があります。このトピックでは、PostgreSQL 出力コンポーネントを構成する方法について説明します。
前提条件
PostgreSQL データソースを追加済みであること。詳細については、「PostgreSQL データソースを作成する」をご参照ください。
PostgreSQL 出力コンポーネントのプロパティを構成するために使用するアカウントに、データソースに対するライトスルー権限が付与されていること。権限がない場合は、データソース権限をリクエストする必要があります。詳細については、「データソース権限のリクエスト、更新、および返却」をご参照ください。
手順
Dataphin ホームページの上部ナビゲーションバーで、[開発] > [Data Integration] を選択します。
統合ページの上部ナビゲーションバーで、[プロジェクト] を選択します(開発-本番モードでは、環境を選択する必要があります)。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン]オフライン パイプライン リストで、開発するオフラインパイプラインをクリックして、構成ページを開きます。
ページの右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。
[コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[出力] を選択します。右側の出力コンポーネントリストで [PostgreSQL] コンポーネントを見つけ、キャンバスにドラッグします。
ターゲット入力コンポーネントの
アイコンをクリックしてドラッグし、現在の PostgreSQL 出力コンポーネントに接続します。PostgreSQL 出力コンポーネントカードの
アイコンをクリックして、[PostgreSQL 出力構成] ダイアログボックスを開きます。
[PostgreSQL 出力構成] ダイアログボックスで、パラメーターを構成します。
パラメーター
説明
[基本設定]
[ステップ名]
PostgreSQL 出力コンポーネントの名前。Dataphin は自動的にステップ名を生成しますが、ビジネスシナリオに基づいて変更できます。名前は次の要件を満たしている必要があります。
中国語、英字、アンダースコア (_)、数字のみ使用できます。
最大 64 文字まで使用できます。
[データソース]
データソースのドロップダウンリストには、ライトスルー権限を持っているかどうかに関係なく、すべての PostgreSQL データソースが表示されます。
アイコンをクリックして、現在のデータソース名をコピーします。ライトスルー権限のないデータソースの場合は、データソースの後に [リクエスト] をクリックして、ライトスルー権限をリクエストできます。詳細については、「データソース権限をリクエストする」をご参照ください。
PostgreSQL データソースがない場合は、
アイコンをクリックして作成します。詳細については、「PostgreSQL データソースを作成する」をご参照ください。
タイムゾーン
時間形式のデータを処理するために使用されるタイムゾーン。デフォルトは、選択したデータソースで構成されたタイムゾーンで、変更できません。
説明V5.1.2 より前に作成されたタスクの場合、[デフォルトのデータソース構成] または [チャネル構成タイムゾーン] を選択できます。デフォルトは [チャネル構成タイムゾーン] です。
デフォルトのデータソース構成: 選択したデータソースのデフォルトのタイムゾーン。
チャネル構成タイムゾーン: 現在の統合タスクの [プロパティ] > [チャネル構成] で構成されたタイムゾーン。
スキーマ (オプション)
スキーマを跨ぐテーブルの選択をサポートします。テーブルが配置されているスキーマを選択します。指定しない場合、デフォルトはデータソースで構成されているスキーマです。
[テーブル]
出力データのターゲットテーブルを選択します。 テーブル名キーワードを入力して検索するか、正確なテーブル名を入力して [完全一致] をクリックします。テーブルを選択すると、システムは自動的にテーブルの状態を確認します。
アイコンをクリックして、現在選択されているテーブルの名前をコピーします。データ同期のターゲットテーブルが MySQL データソースに存在しない場合は、ワンクリックテーブル作成機能を使用して、ターゲットテーブルをすばやく生成できます。次の手順を実行します。
[ワンクリックテーブル作成] をクリックします。Dataphin は、ターゲットテーブル名 (デフォルトはソーステーブル名)、フィールドタイプ (最初は Dataphin フィールドに基づいて変換されます)、およびその他の情報を含む、ターゲットテーブルを作成するためのコードを自動的に照合します。
ビジネス要件に基づいてターゲットテーブルを作成するための SQL スクリプトを変更し、[作成] をクリックします。
ターゲットテーブルが作成されると、Dataphin は自動的にそれを出力データのターゲットテーブルとして設定します。ワンクリックテーブル作成は、開発環境と本番環境でデータ同期のターゲットテーブルを作成するために使用されます。Dataphin はデフォルトでテーブル作成の本番環境を選択します。同じ名前と構造のテーブルが本番環境に既に存在する場合は、本番環境のテーブル作成を選択する必要はありません。
説明同じ名前のテーブルが開発環境または本番環境に存在する場合、[作成] をクリックすると Dataphin はエラーを報告します。
一致する項目がない場合は、手動で入力したテーブル名に基づいて統合を実行することもできます。
ロードポリシー
ターゲットテーブルにデータを書き込むための戦略を選択します。[ロードポリシー] には以下が含まれます。
[データの追加 (insert Into)]:プライマリキー/制約の競合が発生した場合、ダーティデータエラーが報告されます。
[プライマリキーの競合時に更新 (on Conflict Do Update Set)]:プライマリキー/制約の競合が発生した場合、マッピングされたフィールドのデータが既存のレコードで更新されます。
同期書き込み
プライマリキー更新構文はアトミック操作ではありません。書き込まれたデータに重複するプライマリキーがある場合は、同期書き込みを有効にする必要があります。そうでない場合は、並列書き込みが使用されます。同期書き込みは、並列書き込みよりもパフォーマンスが低くなります。
説明このオプションは、ロードポリシーが [プライマリキーの競合時に更新] に設定されている場合にのみ使用できます。
バッチ書き込みデータサイズ (オプション)
一度に書き込むデータのサイズ。[バッチ書き込みレコード] を設定することもできます。いずれかの制限に達すると、システムはデータを書き込みます。デフォルトは 32M です。
バッチ書き込みレコード (オプション)
デフォルトは 2048 レコードです。データを同期する場合、バッチ書き込み戦略が使用され、パラメーターには [バッチ書き込みレコード] と [バッチ書き込みデータサイズ] が含まれます。
累積データが設定された制限 (バッチ書き込みデータサイズまたはレコード数) のいずれかに達すると、システムはデータのバッチがいっぱいになったと見なし、このバッチデータをすぐにターゲットに一度に書き込みます。
バッチ書き込みデータサイズを 32MB に設定することをお勧めします。バッチ挿入レコード制限については、単一レコードの実際のサイズに基づいて柔軟に調整でき、通常はバッチ書き込みの利点を最大限に活用するために大きな値に設定します。たとえば、単一レコードが約 1KB の場合、バッチ挿入バイトサイズを 16MB に設定し、この条件を考慮して、バッチ挿入レコード数を 16MB を単一レコードサイズ 1KB で割った結果よりも大きい値 (つまり、16384 レコードよりも大きい値)、たとえば 20000 レコード に設定します。この構成では、システムはバッチ挿入バイトサイズに基づいてバッチ書き込みをトリガーし、累積データが 16MB に達するたびに書き込み操作を実行します。
プリペアドステートメント (オプション)
データインポートの前にデータベースで実行される SQL スクリプト。
たとえば、継続的なサービスの可用性を確保するために、現在のステップでデータを書き込む前に、まずターゲットテーブル Target_A を作成し、次に Target_A への書き込みを実行します。現在のステップでデータの書き込みが完了した後、継続的にサービスを提供しているテーブル Service_B の名前を Temp_C に変更し、次に Target_A の名前を Service_B に変更し、最後に Temp_C を削除します。
ポストステートメント (オプション)
データインポート後にデータベースで実行される SQL スクリプト。
[フィールドマッピング]
入力フィールド
アップストリーム出力に基づいて入力フィールドを表示します。
出力フィールド
出力フィールドを表示します。次の操作を実行できます。
フィールド管理:[フィールド管理] をクリックして出力フィールドを選択します。

アイコンをクリックして、[選択済みの入力フィールド] を [選択されていない入力フィールド] に移動します。
アイコンをクリックして、[選択されていない入力フィールド] を [選択済みの入力フィールド] に移動します。
一括追加: [一括追加] をクリックして、JSON、TEXT、または DDL 形式で構成します。
JSON 形式での一括構成。例:
// 例: [{ "name": "user_id", "type": "String" }, { "name": "user_name", "type": "String" }]説明name はインポートされたフィールド名を表し、type はインポート後のフィールドタイプを表します。たとえば、
"name":"user_id","type":"String"は、user_id という名前のフィールドをインポートし、そのタイプを String に設定することを意味します。TEXT 形式での一括構成。例:
// 例: user_id,String user_name,String行区切り文字は、各フィールドの情報を区切るために使用されます。デフォルトは改行 (\n) で、改行 (\n)、セミコロン (;)、またはピリオド (.) を使用できます。
列区切り文字は、フィールド名とフィールドタイプを区切るために使用されます。デフォルトはカンマ(,)です。
DDL 形式での一括構成。例:
CREATE TABLE tablename ( id INT PRIMARY KEY, name VARCHAR(50), age INT );
出力フィールドの作成: [+出力フィールドを作成] をクリックし、プロンプトに従って [列] に入力し、[タイプ] を選択します。現在の行の構成が完了したら、
アイコンをクリックして保存します。
[マッピング]
アップストリーム入力とターゲットテーブルのフィールドに基づいて、フィールドマッピングを手動で選択できます。[クイックマッピング] には、[同じ行のマッピング] と [同じ名前のマッピング] が含まれます。
同じ名前のマッピング: 同じ名前のフィールドをマッピングします。
同じ行のマッピング: ソーステーブルとターゲットテーブルのフィールド名が一致しないが、対応する行のデータをマッピングする必要がある場合。同じ行のフィールドのみをマッピングします。
[OK] をクリックして、[PostgreSQL] 出力コンポーネントのプロパティ構成を完了します。