Amazon Redshift 出力コンポーネントは、Amazon Redshift データソースにデータを書き込みます。他のデータソースから Amazon Redshift にデータを同期する場合、ソースデータ情報とターゲット Amazon Redshift データソースの両方を構成する必要があります。このトピックでは、Amazon Redshift 出力コンポーネントを構成する方法について説明します。
前提条件
Amazon Redshift データソースを作成済みであること。詳細については、「Amazon Redshift データソースを作成する」をご参照ください。
Amazon Redshift 出力コンポーネントのプロパティを構成するために使用するアカウントが、データソースに対するライトスルー権限を持っていること。この権限がない場合は、リクエストする必要があります。詳細については、「データソース権限のリクエスト、更新、および返却」をご参照ください。
手順
Dataphin ホームページの上部ナビゲーションバーで、[開発] > [データ統合] を選択します。
統合ページの上部ナビゲーションバーで、[プロジェクト] を選択します (Dev-Prod モードでは、環境を選択する必要があります)。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] リストで、開発するオフラインパイプラインをクリックして、構成ページを開きます。
ページの右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。
[コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[出力] を選択します。右側の出力コンポーネントリストで [Amazon Redshift] コンポーネントを見つけ、キャンバスにドラッグします。
ターゲット入力、変換、またはフローコンポーネントの
アイコンをクリックしてドラッグし、現在の Amazon Redshift 出力コンポーネントに接続します。Amazon Redshift 出力コンポーネントカードの
アイコンをクリックして、[Amazon Redshift 出力構成] ダイアログボックスを開きます。
[Amazon Redshift 出力構成] ダイアログボックスで、パラメーターを構成します。
パラメーター
説明
基本設定
ステップ名
Amazon Redshift 出力コンポーネントの名前。Dataphin は自動的にステップ名を生成しますが、ビジネスシナリオに基づいて変更できます。名前は次の要件を満たしている必要があります。
漢字、英字、アンダースコア (_)、および数字のみを含めることができます。
最大 64 文字まで使用できます。
データソース
データソースドロップダウンリストには、ライトスルー権限を持っているデータソースと持っていないデータソースを含め、すべての Amazon Redshift タイプのデータソースが表示されます。
アイコンをクリックして、現在のデータソース名をコピーします。ライトスルー権限を持っていないデータソースの場合、データソースの後に [リクエスト] をクリックして、ライトスルー権限をリクエストできます。詳細については、「データソース権限をリクエストする」をご参照ください。
Amazon Redshift タイプのデータソースがない場合は、
アイコンをクリックしてデータソースを作成します。詳細については、「Amazon Redshift データソースを作成する」をご参照ください。
タイムゾーン
時間形式のデータは、現在のタイムゾーンに従って処理されます。デフォルトは、選択したデータソースで構成されたタイムゾーンで、変更できません。
説明V5.1.2 より前に作成されたタスクの場合、[デフォルトのデータソース構成] または [チャネル構成のタイムゾーン] を選択できます。デフォルトの選択は [チャネル構成のタイムゾーン] です。
デフォルトのデータソース構成:選択したデータソースのデフォルトのタイムゾーン。
チャネル構成のタイムゾーン:現在の統合タスクの [プロパティ] > [チャネル構成] で構成されたタイムゾーン。
スキーマ (オプション)
スキーマを跨いでのテーブル選択をサポートします。テーブルが配置されているスキーマを選択します。指定しない場合、データソースで構成されているスキーマがデフォルトで使用されます。
テーブル
出力データのターゲットテーブルを選択します。 キーワードを入力してテーブルを検索するか、正確なテーブル名を入力して [完全一致] をクリックします。テーブルを選択すると、システムは自動的にテーブルステータスをチェックします。
アイコンをクリックして、選択したテーブルの名前をコピーします。Amazon Redshift データソースにデータ同期のターゲットテーブルがない場合は、ワンクリックテーブル作成機能を使用してターゲットテーブルを迅速に生成できます。次の手順を実行します。
[ワンクリックテーブル作成] をクリックします。Dataphin は、ターゲットテーブル名(デフォルトはソーステーブル名)、フィールドタイプ(最初は Dataphin フィールドに基づいて変換されます)、およびその他の情報を含む、ターゲットテーブルを作成するためのコードを自動的に一致させます。
ビジネス要件に基づいてターゲットテーブルを作成するための SQL スクリプトを変更し、[作成] をクリックします。
ターゲットテーブルが正常に作成されると、Dataphin は新しく作成されたテーブルを自動的に出力データのターゲットテーブルとして設定します。ワンクリックテーブル作成は、開発環境と本番環境でデータ同期のターゲットテーブルを作成するために使用されます。Dataphin はデフォルトで本番環境をテーブル作成用に選択します。同じ名前と構造のテーブルが本番環境に既に存在する場合は、本番環境のテーブル作成を選択する必要はありません。
説明同じ名前のテーブルが開発環境または本番環境に存在する場合、[作成] をクリックすると、Dataphin はテーブルが既に存在することを示すエラーを報告します。
一致する項目がない場合でも、手動で入力したテーブル名に基づいて統合を実行できます。
バッチ書き込みデータサイズ (オプション)
一度に書き込むデータのサイズ。[バッチ書き込みレコード] も設定できます。書き込み時、システムはいずれかの制限に先に達するとデータを書き込みます。デフォルトは 32M です。
バッチ書き込みレコード (オプション)
デフォルトは 2048 レコードです。データを同期する場合、バッチ書き込み戦略が使用され、パラメーターには [バッチ書き込みレコード] と [バッチ書き込みデータサイズ] が含まれます。
累積データが設定された制限のいずれか(つまり、バッチ書き込みデータサイズまたはレコード数制限)に達すると、システムはデータのバッチがいっぱいになったと見なし、このデータのバッチをすぐにターゲットエンドに一度に書き込みます。
バッチ書き込みデータサイズを 32MB に設定することをお勧めします。バッチ挿入レコード制限については、単一レコードの実際のサイズに基づいて柔軟に調整でき、通常はバッチ書き込みの利点を最大限に活用するために大きな値に設定します。たとえば、単一レコードのサイズが約 1KB の場合、バッチ挿入バイトサイズを 16MB に設定し、この条件を考慮して、バッチ挿入レコード数を 16MB を単一レコードサイズ 1KB で割った結果よりも大きく設定します(つまり、20000 レコードよりも大きいと仮定します)。この構成では、システムはバッチ挿入バイトサイズに基づいてバッチ書き込みをトリガーし、累積データが 16MB に達するたびに書き込み操作を実行します。
プリペアドステートメント (オプション)
データインポートの前にデータベースで実行される SQL スクリプト。
たとえば、継続的なサービスの可用性を確保するために、現在のステップがデータを書き込む前に、最初にターゲットテーブル Target_A を作成し、次に Target_A への書き込みを実行します。現在のステップがデータの書き込みを完了した後、継続的にサービスを提供するテーブル Service_B の名前を Temp_C に変更し、次にテーブル Target_A の名前を Service_B に変更し、最後に Temp_C を削除します。
ポストステートメント (オプション)
データインポート後にデータベースで実行される SQL スクリプト。
フィールドマッピング
入力フィールド
上流からの出力に基づいて入力フィールドを表示します。
出力フィールド
出力フィールドを表示します。次の操作を実行できます。
フィールド管理:[フィールド管理] をクリックして出力フィールドを選択します。

アイコンをクリックして、[選択済みの入力フィールド] を [選択されていない入力フィールド] に移動します。
アイコンをクリックして、[選択されていない入力フィールド] を [選択済みの入力フィールド] に移動します。
一括追加:[一括追加] をクリックして、一括構成の JSON、TEXT 形式、および DDL 形式をサポートします。
JSON 形式での一括構成。例:
// 例: [{ "name": "user_id", "type": "String" }, { "name": "user_name", "type": "String" }]説明name はインポートされたフィールド名を表し、type はインポート後のフィールドタイプを表します。たとえば、
"name":"user_id","type":"String"は、user_id という名前のフィールドをインポートし、そのフィールドタイプを String に設定することを意味します。TEXT 形式での一括構成。例:
// 例: user_id,String user_name,String行デリミタは各フィールドの情報を区切るために使用され、デフォルトは改行(\n)です。改行(\n)、セミコロン(;)、およびピリオド(.)をサポートします。
列デリミタはフィールド名とフィールドタイプを区切るために使用され、デフォルトはカンマ(,)です。
DDL 形式での一括構成。例:
CREATE TABLE tablename ( id INT PRIMARY KEY, name VARCHAR(50), age INT );
新しい出力フィールドの作成:[+ 新しい出力フィールドを作成] をクリックし、プロンプトに従って [列] に入力し、[タイプ] を選択します。現在の行の構成が完了したら、
アイコンをクリックして保存します。
マッピング
上流の入力とターゲットテーブルのフィールドに基づいて、フィールドマッピングを手動で選択できます。[クイックマッピング] には、[同じ行のマッピング] と [同じ名前のマッピング] が含まれます。
同じ名前のマッピング:同じ名前のフィールドをマッピングします。
同じ行のマッピング:ソーステーブルとターゲットテーブルのフィールド名が一致しないが、対応する行のデータをマッピングする必要がある場合。同じ行のフィールドのみをマッピングします。
[OK] をクリックして、[Amazon Redshift] 出力コンポーネントのプロパティ構成を完了します。