出力コンポーネントを使用して AnalyticDB for PostgreSQL にデータを書き込む - Dataphin

AnalyticDB for PostgreSQL 出力コンポーネントは、データを AnalyticDB for PostgreSQL データソースに書き込みます。他のデータソースから AnalyticDB for PostgreSQL データソースにデータを同期する場合、ソースデータの構成が完了した後、AnalyticDB for PostgreSQL 出力コンポーネントのターゲットデータソースを構成します。

前提条件

AnalyticDB for PostgreSQL データソースを作成済みであること。詳細については、「AnalyticDB for PostgreSQL データソースの作成」をご参照ください。
AnalyticDB for PostgreSQL 入力コンポーネントの構成に使用するアカウントには、データソースに対するライトスルー権限が必要です。この権限がない場合は、リクエストしてください。詳細については、「データソース権限のリクエスト」をご参照ください。

操作手順

Dataphin ホームページのトップメニューバーで、[開発] をクリックし、次に [データ統合] をクリックします。
統合ページで、トップメニューバーから [プロジェクト] を選択します。開発/本番モードでは、環境も選択します。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] リストで、開発するオフラインパイプラインをクリックします。オフラインパイプラインの構成ページが開きます。
ページの右上隅で、[コンポーネントライブラリ] をクリックして [コンポーネントライブラリ] パネルを開きます。
「コンポーネントライブラリ」パネルの左側のナビゲーションウィンドウで、[出力] をクリックします。右側の出力コンポーネントリストで、AnalyticDB for PostgreSQL コンポーネントを探し、キャンバスにドラッグします。
ターゲットの入力、変換、またはフローコンポーネントのアイコンをクリックしてドラッグし、AnalyticDB for PostgreSQL 出力コンポーネントに接続します。
AnalyticDB for PostgreSQL 出力コンポーネントカードで、アイコンをクリックして、[AnalyticDB For PostgreSQL 出力設定] ダイアログボックスを開きます。

[AnalyticDB For PostgreSQL 出力設定] ダイアログボックスで、以下のパラメーターを設定します。

パラメーター		説明
基本情報	ステップ名	AnalyticDB for PostgreSQL 出力コンポーネントの名前です。Dataphin はステップ名を自動的に生成します。ビジネスシナリオに基づいて変更できます。命名規則は次のとおりです。漢字、英字、アンダースコア (_)、および数字のみを使用します。名前は 64 文字以内にする必要があります。
	データソース	ドロップダウンリストには、すべての AnalyticDB for PostgreSQL データソースが表示されます。これには、ライトスルー権限を持つデータソースと持たないデータソースが含まれます。アイコンをクリックして、現在のデータソース名をコピーします。データソースのライトスルー権限がない場合は、データソースの横にある[リクエスト]をクリックして、ライトスルー権限をリクエストしてください。詳細については、「データソース権限のリクエスト」をご参照ください。 AnalyticDB for PostgreSQL データソースがない場合は、[データソースの作成] をクリックして作成します。詳細については、「AnalyticDB for PostgreSQL データソースの作成」をご参照ください。
	タイムゾーン	Dataphin は、現在のタイムゾーンに基づいて時間形式のデータを処理します。デフォルトでは、これは選択したデータソースに構成されているタイムゾーンと一致します。この設定は変更できません。説明バージョン V5.1.2 より前に作成されたタスクでは、[データソースのデフォルト設定] または [チャネル設定のタイムゾーン] を選択できます。デフォルトの選択肢は [チャネル設定のタイムゾーン] です。データソースのデフォルト設定: 選択したデータソースのデフォルトタイムゾーンです。 [チャネル構成のタイムゾーン]: 現在の統合タスクで「プロパティ」＞「チャネル構成」に設定されたタイムゾーンです。
	スキーマ (オプション)	テーブルが存在するスキーマを選択します。クロススキーマテーブル選択がサポートされています。スキーマを指定しない場合、データソースに構成されているデフォルトスキーマが使用されます。
	テーブル	出力データの対象テーブルを選択します。テーブルを検索するにはキーワードを入力するか、正確なテーブル名を入力して [完全一致検索] をクリックします。テーブルを選択すると、システムが自動的にそのステータスを確認します。アイコンをクリックして、選択したテーブルの名前をコピーします。ターゲットテーブルが AnalyticDB for PostgreSQL データソースに存在しない場合は、ワンクリックテーブル作成機能を使用して迅速に生成します。次の手順に従います。 [テーブルの作成] をクリックします。Dataphin は、ターゲットテーブルを作成する SQL スクリプトを自動的に生成します。このスクリプトには、テーブル名 (デフォルト: ソーステーブル名) とフィールド型 (Dataphin フィールドから変換) が含まれます。必要に応じて SQL スクリプトを変更し、[作成] をクリックします。テーブルが作成されると、Dataphin はそれを出力データのターゲットテーブルとして使用します。説明開発環境に同じ名前のテーブルが存在する場合、[作成] をクリックすると、テーブルがすでに存在するというエラーが返されます。
	本番テーブル欠落ポリシー	このポリシーでは、存在しない本番テーブルの処理方法を定義します。[何もしない] または [自動作成] を選択できます。デフォルトは [自動作成] です。[何もしない] を選択した場合、タスクは本番テーブルを作成せずに公開されます。[自動作成] を選択した場合、タスクは公開中にターゲット環境に同じ名前のテーブルを作成します。 [No Action]: ターゲットテーブルが存在しない場合、システムは送信時に警告を表示しますが、公開は許可されます。タスクを実行する前に、本番環境でターゲットテーブルを手動で作成する必要があります。自動作成: [テーブル作成文の編集] が必要です。システムは、選択したテーブルのテーブル作成文をデフォルトで事前に入力し、これを変更することができます。文内のテーブル名にはプレースホルダー `${table_name}` が使用され、このプレースホルダーのみが許可されます。実行時に、プレースホルダーは実際のテーブル名に置き換えられます。ターゲットテーブルが存在しない場合、Dataphin はまずステートメントを使用して作成します。作成が失敗した場合、公開も失敗します。エラーメッセージに基づいてステートメントを修正し、再公開してください。ターゲットテーブルがすでに存在する場合、操作は実行されません。説明この設定は、Dev-Prod モードのプロジェクトでのみ利用可能です。
	読み込みポリシー	[挿入] および [コピー] ポリシーをサポートします。挿入ポリシー：AnalyticDB for PostgreSQL の `INSERT INTO ... VALUES ...` ステートメントを使用してデータを書き込みます。プライマリキーまたは一意なインデックスの競合が発生した場合、競合する行の書き込みは失敗し、ダーティデータになります。まず挿入モードを使用することを推奨します。 copy ポリシー: AnalyticDB for PostgreSQL の `COPY FROM` コマンドを使用して、テーブルにデータを読み込みます。競合解決戦略をサポートします。パフォーマンスの問題が発生した場合のみ、このポリシーを使用してください。また、[競合解決戦略]（例：[競合時のエラー] または [競合時の上書き]）を設定してください。重要競合解決戦略は、AnalyticDB for PostgreSQL のカーネルバージョン 4.3 より高いコピーモードでのみ機能します。タスクの失敗を防ぐため、カーネルバージョン 4.3 より低いバージョンまたは不明なバージョンでは使用しないでください。
	バッチ書き込みサイズ (オプション)	1回のバッチで書き込まれるデータサイズです。[バッチ書き込み数] とこのパラメーターの両方を設定できます。いずれかの上限に達すると、システムはデータを書き込みます。デフォルトは 32 MB です。
	バッチ書き込み数 (オプション)	デフォルトは 2,048 行です。データ同期ではバッチ書き込みが使用されます。主要なパラメーターはバッチ書き込み数およびバッチ書き込みサイズです。蓄積されたデータがサイズまたは数のいずれかの制限に達すると、システムはそれをフルバッチとして扱い、すぐに宛先に書き込みます。バッチ書き込みサイズを 32 MB に設定することを推奨します。平均レコードサイズに基づいてバッチ書き込み数を調整します。バッチ効率を最大化するために大きな値を使用します。たとえば、各レコードが約 1 KB の場合、バッチ書き込みサイズを 16 MB に設定します。次に、バッチ書き込み数を 16,384 (16 MB ÷ 1 KB) より大きく設定します。ここでは 20,000 行を使用します。この設定により、蓄積されたデータが 16 MB に達すると、システムはバッチ書き込みをトリガーします。
	準備ステートメント (オプション)	データインポート前にデータベースで実行する SQL スクリプトです。たとえば、継続的なサービス可用性を確保するには、次の手順を実行します。まず、ターゲットテーブル Target_A を作成します。次に、Target_A にデータを書き込みます。書き込みが完了したら、ライブサービステーブル Service_B を Temp_C に名前変更します。次に、Target_A を Service_B に名前変更します。最後に、Temp_C を削除します。
	最終処理ステートメント (オプション)	データインポート後にデータベースで実行する SQL スクリプトです。
フィールドマッピング	入力フィールド	アップストリームコンポーネントからの入力フィールドをリスト表示します。
	出力フィールド	出力フィールドをリスト表示します。次の操作を実行できます。フィールド管理: [フィールド管理] をクリックして、出力フィールドを選択します。アイコンをクリックして、[選択済み入力フィールド] を [未選択入力フィールド] に移動します。アイコンをクリックして、[未選択入力フィールド] を [選択済み入力フィールド] に移動します。一括追加：[一括追加] をクリックして、JSON、TEXT、または DDL フォーマットでフィールドを設定します。 JSON 形式の例： `// Example: [{ "name": "user_id", "type": "String" }, { "name": "user_name", "type": "String" }]` 説明「name」フィールドはフィールド名です。「type」フィールドはデータの型です。たとえば、`"name":"user_id","type":"String"` は user_id という名前のフィールドをインポートし、そのタイプを String に設定します。 TEXT 形式の例： `// Example: user_id,String user_name,String` 行区切り文字はフィールドエントリを区切ります。デフォルトは改行 (\n) です。その他のオプションには、セミコロン (;) とピリオド (.) があります。列区切り文字はフィールド名をフィールドタイプから区切ります。デフォルトはコンマ (,) です。 DDL 形式での一括構成 (例：) `CREATE TABLE tablename ( id INT PRIMARY KEY, name VARCHAR(50), age INT );` 出力フィールドの作成: [+ 出力フィールドの作成] をクリックします。 [列] 名を入力し、[タイプ] を選択します。アイコンをクリックして、行を保存します。
	マッピング	アップストリーム入力のフィールドを、ターゲットテーブルのフィールドに手動でマッピングします。 [マッピング] には [行マッピング] と [名前マッピング] が含まれます。 [名前マッピング]：同一の名前を持つフィールドをマッピングします。 [行マッピング]：ソースとターゲットのフィールド名が異なる場合、位置によってフィールドをマッピングします。

[確定] をクリックして、AnalyticDB for PostgreSQL 出力コンポーネントの構成を完了します。